当前位置：首页 > news >正文

餐饮网站建设的模板如何自己制作链接内容

news 2025/12/22 11:52:02

餐饮网站建设的模板,如何自己制作链接内容,秦皇岛海三建设董事长,邯郸科技有限公司文章目录 0. 数据代码下载1. 背景描述2. 预测目的3. 数据总览4. 数据预处理4.1数据描述性统计与清洗a. 导入程序库b. 读取数据c. 查看统计信息和空值d. 查看是否有重复数据以及清理重复数据e. 空值清理f. 针对清洗后的数据进行统计分析 5. 探索性数据分析5.1 数据分析 6. 构建 … 文章目录 0. 数据代码下载1. 背景描述2. 预测目的3. 数据总览4. 数据预处理4.1数据描述性统计与清洗a. 导入程序库b. 读取数据c. 查看统计信息和空值d. 查看是否有重复数据以及清理重复数据e. 空值清理f. 针对清洗后的数据进行统计分析 5. 探索性数据分析5.1 数据分析 6. 构建 ARIMA 时序模型6.1 ARIMA 模型概念6.2 序列平稳性检验6.3 对原始序列进行一阶差分并进行平稳性和白噪声检验a. 对一阶差分后的序列再次做平稳性判断。b. 对一阶差分后的序列做白噪声检验 6.4 对一阶差分后的序列拟合 ARMA 模型第一种方法人为识别第二种方法相对最优模型识别。 6.5 ARIMA 模型预测 7. 实际应用0. 数据代码下载 0. 数据代码下载关注公众号『AI学习星球』回复实现时间序列分析建模即可获取数据下载。算法学习、4对1辅导、论文辅导或核心期刊可以通过公众号或CSDN滴滴我 1. 背景描述当今世界正处于一个数据信息时代随着后续互联网的发展各行各业都会产生越来越多的数据包括不限于商店、超市、便利店、餐厅等等。那么这里面很多数据都是随着时间产生的这就形成了时间序列数据而且很多时间序列数据都是非平稳时间序列数据。目前对非平稳时间序列分析应用最多的模型就是ARIMA 模型. 2. 预测目的本项目也是通过 Python 程序来进行数据探索性分析、数据预处理、构建 ARIMA 时序模型以及如何把模型预测的结果应用于日常的实际生活当中。 3. 数据总览本次建模数据来源于某公司餐厅销售数据其主要的数据基本统计概况如下数据项2 项(日期、销量)如下图所示通过观察数据发现一些空值和一些重复数据后续章节进行处理。 4. 数据预处理真实数据中可能包含了大量的缺失值和噪音数据或人工录入错误导致有异常点存在非常不利于算法模型的训练。数据清洗的结果是对各种脏数据进行对应方式的处理得到标准的干净的、连续的数据提供给数据统计、数据挖掘等使用。数据预处理通常包含数据清洗、归约、聚合、转换、抽样等方式数据预处理质量决定了后续数据分析挖掘及建模工作的精度和泛化价值。 4.1数据描述性统计与清洗 a. 导入程序库将所用到的程序库导入到 Python 程序中如图所示。 import pandas as pd import matplotlib.pyplot as plt from statsmodels.graphics.tsaplots import plot_acf from statsmodels.tsa.stattools import adfuller as ADF from statsmodels.graphics.tsaplots import plot_pacf from statsmodels.stats.diagnostic import acorr_ljungbox from statsmodels.tsa.arima_model import ARIMAb. 读取数据使用 Pandas 库中 read_excel 方法读取 Excel 数据并转为DataFrame 类型。读取数据代码如图所示 # 读取数据指定日期列为指标pandas自动将“日期”列识别为Datetime格式 data pd.read_excel(discfile)c. 查看统计信息和空值 print(data.describe()) print(data.info())从上图可以看到数据总数据量 40 条(不包括空值)以及未去除重复值的平均值、标准差、最小值、最大值、分位数。另外可以看到销量有 2 条空值。 d. 查看是否有重复数据以及清理重复数据 print(data.duplicated(subset[日期, 销量])) data data.drop_duplicates(subset[日期, 销量], keepfirst)从上图中的部分展示可以看到是有重复数据所以使用 drop_duplicates()函数进行了重复数据清理。 e. 空值清理本项目涉及 2 条空值数据直接进行丢弃操作。空值的处理也可以用均值填充、分位数填充、拉格朗日插值填充等等(根据具体数据处理的需要进行即可)。 data data.dropna()f. 针对清洗后的数据进行统计分析 print(data.describe()) print(data.info())从上图可以看出清洗后数据量为 37 条平均值为 3542.49、标准差为 543.92。 5. 探索性数据分析 5.1 数据分析销量时间序列分析关键代码如下 plt.rcParams[font.sans-serif] [SimHei] # 用来正常显示中文标签 plt.rcParams[axes.unicode_minus] False # 用来正常显示负号 data.plot(colorgreen, markero, linestyledashed, linewidth1, markersize6) plt.ylabel(销量) plt.title(销量量时间序列分析图)6. 构建 ARIMA 时序模型 6.1 ARIMA 模型概念在自然界中绝大部分序列都是非平稳的。因而非平稳时间序列的分析更普遍、更重要创造出来的分析方法也更多。非平稳时间序列的分析方法可以分为确定性因素分解的时序分析和随机时序分析两大类。确定性因素分解的方法把所有序列的变化都归结为 4 个因素长期趋势、季节变动、循环变动和随机波动的综合影响其中长期趋势和季节变动的规律性信息通常比较容易提取而由随机因素导致的波动则非常难以确定和分析对随机信息浪费严重会导致模型拟合精度不够理想。随机时序分析法的发展就是为了弥补确定性因素分解方法的不足。根据时间序列的不同特点随机时序分析可以建立的模型有 ARIMA 模型、残差自回归模型、季节模型、异方差模型等。本项目重点介绍 ARIMA 模型对非平稳时间序列进行建模。差分运算 p 阶差分相距一期的两个序列值之间的减法运算称为 1 阶差分运算。 k 步差分相距 k 期的两个序列值之间的减法运算称为 k 步差分运算。差分运算具有强大的确定性信息提取能力许多非平稳序列差分后会显示出平稳序列的性质这时称这个非平稳序列为差分平稳序列。差分平稳序列可以使用 ARMA 模型进行拟合。ARIMA 模型的实质就是差分运算与 ARMA 模型的组合。 6.2 序列平稳性检验此图显示该序列具有明显的单调递增趋势可以判断为非平稳序列。此图的自相关图显示自相关系数长期大于零说明序列间具有很强的长期相关性。此表单位根检验统计量对应的 p 值显著大于 0.05最终将该序列判断为非平稳序列非平稳序列一定不是白噪声序列。 6.3 对原始序列进行一阶差分并进行平稳性和白噪声检验 a. 对一阶差分后的序列再次做平稳性判断。结果显示一阶差分之后序列的时序图在均值附近比较平稳地波动、自相关图有很强的短期相关性、单位根检验 p 值小于 0.05所以一阶差分之后的序列是平稳序列。 b. 对一阶差分后的序列做白噪声检验此表输出的 p 值远小于 0.05所以一阶差分之后的序列是平稳非白噪声序列. 6.4 对一阶差分后的序列拟合 ARMA 模型下面进行模型定阶。模型定阶就是确定 p 和 q。第一种方法人为识别根据图 5-25 进行模型定阶。一阶差分后自相关图显示出 1 阶截尾偏自相关图显示出拖尾性所以可以考虑用 MA(1)模型拟合 1 阶差分后的序列即对原始序列建立 ARIMA(011)模型。第二种方法相对最优模型识别。计算 ARMA(pq) 当 p 和 q 均小于等于 3 的所有组合的 BIC 信息量取其中BIC 信息量达到最小的模型阶数。计算完成 BIC 矩阵如下当 p 值为 0、q 值为 1 时最小 BIC 值为 422.510082。p、q 定阶完成。用 AR(1)模型拟合一阶差分后的序列即对原始序列建立 ARIMA(011)模型。虽然两种方法建立的模型是一样的但模型是非唯一的。ARIMA(110)和ARIMA(111)这两个模型也能通过检验。下面对一阶差分后的序列拟合 AR(1) 模型进行分析: 1参数检验和参数估计见下表: 2模型检验之残差检验 D-W 检验 DW 值显著的接近于 0 或时则存在自相关性而接近于时则不存在一阶自相关性。D-W 检验的结果为1.9735。因此模型预测的残差不存在自相关性性这说明拟合的模型预测效果很好。残差序列的白噪声检验结果为 (array([0.00390439]), array([0.95017654]))可以看出 p 值为 0.9502 P0.05.说明原假设成立。 6.5 ARIMA 模型预测应用 ARIMA(011)对表某餐厅的销售数据做为期 5 天的预测结果如下表所示需要说明的是利用模型向前预测的时期越长预测误差将会越大这是时间预测的典型特点。代码如下 # 参数初始化 discfile data.xlsx forecastnum 5# 读取数据指定日期列为指标pandas自动将“日期”列识别为Datetime格式 data pd.read_excel(discfile) print(data.describe()) print(data.info())print(data.duplicated(subset[日期, 销量])) data data.drop_duplicates(subset[日期, 销量], keepfirst) data data.dropna() print(data.describe()) print(data.info()) data data.set_index(日期) print(data.head())# 时序图plt.rcParams[font.sans-serif] [SimHei] # 用来正常显示中文标签 plt.rcParams[axes.unicode_minus] False # 用来正常显示负号 data.plot(colorgreen, markero, linestyledashed, linewidth1, markersize6) plt.ylabel(销量) plt.title(销量量时间序列分析图) plt.show()# 自相关图plot_acf(data) plt.title(原始序列的自相关图) plt.show()# 平稳性检测print(u原始序列的ADF检验结果为, ADF(data[u销量])) # 返回值依次为adf、pvalue、usedlag、nobs、critical values、icbest、regresults、resstore# 差分后的结果 D_data data.diff().dropna() D_data.columns [u销量差分] D_data.plot(colorgreen, markero, linestyledashed, linewidth1, markersize6) # 时序图 plt.title(一阶差分之后序列的时序图) plt.ylabel(销量) plt.show() plot_acf(D_data) # 自相关图 plt.title(一阶差分之后序列的自相关图) plt.show()print(u差分序列的ADF检验结果为, ADF(D_data[u销量差分])) # 平稳性检测# 白噪声检验print(u差分序列的白噪声检验结果为, acorr_ljungbox(D_data, lags1)) # 返回统计量和p值plot_pacf(D_data) # 偏自相关图 plt.title(一阶差分后序列的偏自相关图) plt.show()# 定阶 data[u销量] data[u销量].astype(float) pmax int(len(D_data) / 10) # 一般阶数不超过length/10 qmax int(len(D_data) / 10) # 一般阶数不超过length/10 bic_matrix [] # BIC矩阵 for p in range(pmax 1):tmp []for q in range(qmax 1):try: # 存在部分报错所以用try来跳过报错。tmp.append(ARIMA(data, (p, 1, q)).fit().bic)except:tmp.append(None)bic_matrix.append(tmp)bic_matrix pd.DataFrame(bic_matrix) # 从中可以找出最小值 print(BIC矩阵) print(bic_matrix)tmp_data bic_matrix.values tmp_data tmp_data.flatten() s pd.DataFrame(tmp_data, columns[value]) s s.dropna() print(BIC最小值, s.min()) s.to_excel(tmp.xlsx)p, q bic_matrix.stack().idxmin() # 先用stack展平然后用idxmin找出最小值位置。 print(uBIC最小的p值和q值为%s、%s % (p, q))model ARIMA(data, (p, 1, q)).fit() # 建立ARIMA(0, 1, 1)模型 print(模型报告为\n, model.summary2()) print(模型报告为\n, model.summary()) resid model.resid # 自相关图 plot_acf(resid) plt.title(残差自相关图) plt.show() # 偏自相关图 plot_pacf(resid) plt.title(残差偏自相关图) plt.show() # 线性即正态分布 qqplot(resid, lineq, fitTrue) plt.title(残差Q-Q图) plt.show() # 解读残差服从正态分布均值为零方差为常数 print(D-W检验的结果为, sm.stats.durbin_watson(resid.values)) print(残差序列的白噪声检验结果为, acorr_ljungbox(resid, lags1)) # 返回统计量、P值print(预测未来5天其预测结果、标准误差、置信区间如下\n, model.forecast(5))7. 实际应用通过上面的预测结果分析得到此模型能够在误差允许的范围内进行预测未来的销量可以将此模型应用于实际生产中帮助企业更好地备货。 0. 数据代码下载关注公众号『AI学习星球』回复实现时间序列分析建模即可获取数据下载。算法学习、4对1辅导、论文辅导或核心期刊可以通过公众号或CSDN滴滴我

查看全文

http://www.pierceye.com/news/210220/