当前位置: 首页 > news >正文

长沙免费建站网络营销室内设计多久能学出来

长沙免费建站网络营销,室内设计多久能学出来,我为什么不建议年轻人做销售,熊掌号怎么做网站跳转链接线性回归模型属于经典的统计学模型#xff0c;该模型的应用场景是根据已知的变量#xff08;自变量#xff09;来预测某个连续的数值变量#xff08;因变量#xff09;。例如#xff0c;餐厅根据每天的营业数据#xff08;包括菜谱价格、就餐人数、预定人数、特价菜折扣…线性回归模型属于经典的统计学模型该模型的应用场景是根据已知的变量自变量来预测某个连续的数值变量因变量。例如餐厅根据每天的营业数据包括菜谱价格、就餐人数、预定人数、特价菜折扣等预测就餐规模或营业额网站根据访问的历史数据包括新用户的注册量、老用户分活跃度、网页内容的更新频率等预测用户的支付转化率。在开始多元线性模型前介绍下一元线性模型。数学公式可以表示为一个因变量一个自变量。参数求解公式为多元线性回归模型与一元线性回归模型的区别就是自变量的增加。其数学表达式为可以简写为β代表多元线性回归模型的偏回归系数e代表了模型拟合后每一个样本的误差项。利用最小二乘法求解β可以得到将相应的x值y值代入公式即可求得β。我们构建模型的目的是为了预测即根据已知的自变量X值预测未知的因变量y的值。本文是利用Python 实现这一目标。这里以某产品的利润数据集为例该数据集包含5个变量分别是产品的研发成本、管理成本、市场营销成本、销售市场和销售利润。其中销售利润Profit为因变量其他变量为自变量。回归模型的建模和预测将导入数据的数据进行切割训练集用来训练模型测试集用来预测。测试集删除因变量Profit剩下的自变量进行预测结果用来跟删除的因变量进行对比比较模型的预测能力。数据集中的State变量为字符型的离散变量需要进行哑变量处理。将State套在C()中表示将其当作分类Category变量处理。以上默认State(California)为对照组。接下来通过pandas中的get_dummies函数生成哑变量以New York作为对照组。如上结果所示从离散变量State中衍生出来的哑变量在回归系数的结果里只保留了Florida和California而New York作为了参照组。得到的结果表示该模型公式为Profit58068.050.80RD_Spend-0.06Administation0.01Marketing_Spend1440.86Florida513.47California如何解释该模型呢以RD_Spend和Florida为例在其他变量不变的情况下研发成本每增加2美元利润会增加0.80美元在其他变量不变的情况下以New York为基准线如果在Florida销售产品利润会增加1440.86美元。虽然模型已经建成但是模型的好坏还需要模型的显著性检验和回归系数的显著性检验。回归模型的假设检验模型的显著性检验使用F检验。手工计算F值和模型自带的F统计值计算完全一致。接下俩将计算得出的F统计值和理论F分布的值进行比较。计算出的F统计值远远大于理论F值这里可以拒绝原假设即认为多元线性回归是显著的也就是回归模型的偏回归系数不全为0。回归系数的显著性检验t检验如上结果所示模型的概览信息包含三个部分第一部分主要是有关模型的信息例如模型的判决系数R2用来衡量自变量对因变量的解释程度模型的F统计值用来检验模型的显著性第二部分主要包含偏回归系数的信息例如回归系数的Coef、t统计量值、回归系数的置信区间等第三部分主要涉及模型的误差项e的有关信息。在第二部分的内容中含有每个偏回归系数的t统计量值它的计算就是由估计值coef和标准差std err的商所得的同时也有t统计量值对应的概率值p用来判别统计量是否显著的直接办法通常概率值p小于0.05时表示拒绝原假设。从返回的结果可知只有截距项Intercept和研发成本RD_Spend对应的值小于0.05才说明其余变量都没有通过系数的显著性检验即在模型中这些变量不是影响利润的重要因素。回归模型的诊断当回归模型建好之后并不意味着建模过程的结束还需要进一步对模型进行诊断。由统计学知识可知线性回归模型需要满足一些假设前提只有满足了这些假设模型才是合理的。需满足误差e服从正态分布无多重共线性线性相关性误差项e的独立性方差齐性。正态性检验由yXβe来说等式右边的自变量属于已知变量而等式左边的因变量服从正态分布要求残差项要求正态分布但其实质就是要求因变量服从正态分布。关于正态性检验通常运用两类方法分别是定性的图形法直方图、PP图或QQ图和定量的非参数法Shapiro检验和K-S检验以下是直方图法从图中看和密度曲线和正态分布密度曲线的趋势比较吻合故直观上可以认为利润变量服从正态分布。以下是PP图和QQ图法PP图思想是对比正态分布的累计概率值和实际分布的累计概率值而QQ图则比正态分布的分位数和实际分布的分位数。判断变量是否近似服从正态分布的标准是如果散点都比较均匀地散落在直线上就说明近似服从正态分布否则就认为数据不服从正态分布。如图所知不管是PP图还是QQ图绘制的散点均落在直线的附近没有较大的偏离故认为利润变量近似服从正态分布。多重共线性检验多重共线性是指模型中的自变量之间存在较高的线性相关关系它的存在给模型带来严重的后果。可以使用方差膨胀因子VIF来鉴定如果VIF大于10则说明变量间存在多重共线性如果如果VIF大于100则表明变量之间存在严重的多重共线性。VIF的计算公式为:如上计算所示两个自变量对应的方差膨胀因子均小于10说明构建模型的数据并不存在多重共线性。线性相关性检验线性相关性即用于建模的因变量和自变量之间存在线性相关关系可以使用Pearson相关系数和可视化方法进行识别皮尔逊计算公式为: 如上图结果所示自变量中只有研发成本和市场营销成本与利润之间存在较高的相关系数相关系数分别达到0.978和0.739而其他变量与利润之间几乎没有线性相关性可言。以管理成本Administration为例与利润之间的相关系数只有0.2被认定为不相关但是能说明两者不具有线性相关关系当存在非线性相关关系时皮尔逊系数也会很小因此需要可视化的方法观测因变量和自变量之间的散点关系。可以使用seaborn模块中的pairplot函数。从图中结果可知研发成本和利润之间的散点图几乎为一条向上倾斜的直线左下角说明这两种变量之间确实存在很强的线性相关市场营销成本与利润之间的散点图同样向上倾斜但也有很多点的分布还是比较分散的见第一列第三行管理成本和利润之间的散点图呈水平趋势而且分布也比较宽说明两者之间确实没有任何关系第一列第二行。以重构的model2为例综合考虑相关系数散点图矩阵和t检验的结果最终确定只保留model2中的RDSpend和Marketing_Spend两个自变量下面重新对该模型做修正。异常值检验由于多元线性回归模型容易受到极端值的影响故需要利用统计方法对观测样本进行异常点检测。如果在建模过程发现异常数据需要对数据集进行整改如删除异常值或衍生出是否为异常值的哑变量。对于线性回归模型通常利用帽子矩阵DFFITS准则学生化残差或cook距离进行异常点检测。基于get_influence方法获得四种统计量的值。以上合并了四种统计量的值这里使用标准化残差法将异常值查询出来当标准化残差大于2时即可认为对应的数据点为异常值。异常比例为2.5%比较小故考虑将其删除。新的模型公式为Profit51827.420.80RD_Spend0.02Marketing_Spend独立性检验残差e的独立性检验也就是因变量y的独立性检验。通常使用Durbin-Watson统计值来测试如果DW值在2 左右则表明残差之间时不相关的如果与2偏离的教员则说明不满足残差的独立性假设。DW统计量的值为2.065比较接近于2故可以认为模型的残差项之间是满足独立性这个假设前提的。方差齐性检验方差齐性是要求模型残差项的方差不随自变量的变动而呈现某种趋势否则残差的趋势就可以被自变量刻画。关于方差齐性的检验一般可以使用两种方法即图形法散点图和统计检验法BP检验。如图所示标准化残差没有随自变量的变动而呈现喇叭性所有的散点几乎均匀的分布在参考线y0的附近。所以可以说明模型的残差项满足方差齐性的前提假设。经过前文的模型构造、假设检验和模型诊断最新红确定合理的模型model4。接下来就是利用测试集完成预测。如上图所示绘制了有关模型在测试集上的预测值和实际值的散点图。两者非常接近散点在直线附近波动说明模型的预测效果还是不错的。
http://www.pierceye.com/news/109273/

相关文章:

  • 山东响应式网站设置字体颜色的网站
  • 美容院网站建设西安有关做网站的公司有哪些
  • 湛江做网站设计公司网络推广网站培训班
  • 大型网站建立萝岗微信网站建设
  • 门户网站建设发展趋势官网网站怎么创建
  • 企业网站如何做自然搜索phpcms 网站转移
  • 站内优化怎么做建设设计网站
  • 如何建设机器人教育网站上海有名的网络公司
  • 网站二级目录做网站淄博网站建设 很乱
  • 常州做网站企业海口网站开发建设
  • 做php网站用什么软件开发wordpress页面图片轮播图
  • 做网站页面大小多大8上的信息课做网站作业
  • 自己做微网站创欧科技 网站建设
  • 网站设计师大学学什么专业北京燕华工程建设有限公司网站
  • 广州专业网站建设企业wordpress 数据库修改
  • 淮南装饰公司网站建设seo 网站树
  • 设计素材下载网站网络营销课程设计报告
  • 安庆公司做网站搜索引擎收录提交入口
  • 城固网站建设wordpress主题谁的最好
  • 国外建站企业北京鑫创网站建设
  • 网站做视频wordpress插件手动升级
  • wordpress收不到网站没有收款接口网站怎么做收款
  • 信阳做网站推广用tornado做网站
  • 网站开发与数据库ppt成都优化网站建设
  • 毕业设计静态网站建设选题依据企业网络营销的优势
  • 网站图片动态换名网站充值支付宝收款怎么做
  • 蜘蛛网是个什么网站做特卖的购物网站
  • 从零学做网站古典 网站模板
  • h5网站模板开发网站后台哪些功能需要前端配合
  • 网站建设 宜宾佛山企业网站自助建站