当前位置: 首页 > news >正文

小说网站源码wordpress数据录入

小说网站源码,wordpress数据录入,世界500强企业有哪些,温州做网站最好的文 | Matrix.小泽直树最近在看李沐的实用机器学习课程#xff0c;讲到regression问题的loss的时候有弹幕问#xff1a;“为什么要平方#xff1f;”如果是几年前学生问我这个问题#xff0c;我会回答#xff1a;“因为做回归的时候的我们的残差有正有负#xff0c;取个平… 文 | Matrix.小泽直树最近在看李沐的实用机器学习课程讲到regression问题的loss的时候有弹幕问“为什么要平方”如果是几年前学生问我这个问题我会回答“因为做回归的时候的我们的残差有正有负取个平方求和以后可以很简单的衡量模型的好坏。同时因为平方后容易求导数比取绝对值还要分情况讨论好用。”但是经过了几年的科研以后我觉得这样的回答太过于经验性了一定会有什么更有道理的解释于是在知乎上搜了搜。《CC思SS回归模型中的代价函数应该用MSE还是MAE[1]》 这篇文章中提到MSE对于偏差比较大的数据惩罚得比较多但是会被outlier影响同时MSE的优化目标是平均值而MAE的优化目标是中位数。即如果我们的数据集足够大对于同一个x会有多个yMSE的目标是尽可能让我们的预测值接近这些y的平均值。同时这篇文章还提到在做gradient descent的时候MSE的梯度可以在越接近最小值的地方越平缓这样不容易步子扯大了。而MAE的梯度一直不变得手动调整learning rate。《在回归问题中为何对MSE损失的最小化等效于最大似然估计[2]》而这个问题里有人提到“根据中心极限定理误差服从正态分布此时使得样本似然函数最大等价于使得MSE最小。” 这段话引起了我的兴趣在查阅了一些英文资料以后发现这是来自于花书的结论Ian的《Deep Learning》。以下解释来源于花书5.5和[这篇博客][3]要弄懂为什么回归问题要用MSE首先要先明白什么是极大似然估计MLEMaximum Likelihood Estimation。极大似然估计MLE用一个一维的数据来讲解MLE的过程假设我们有一组数据我们假设它服从正态分布我们的目的是找到一组正态分布的均值和方差使得在这套正态分布的均值方差下我们观测到这批数据的概率最大。手上的数据关于这组数据我们先胡乱地猜测一下它符合的正态分布如下胡乱猜测的正态分布对于这个正态分布我们可以计算每个点出现的概率 。其中 和 是这个正态分布的均值和方差 是第 条数据我们把每条数据出现的概率相乘得到了“在这套正态分布的均值方差下我们观测到这批数据的概率”。同样的我们可以猜测另一种正态分布另一种猜测的正态分布同样的我们可以计算“在这套正态分布的均值方差下我们观测到这批数据的概率”。最后我们在这群待选的均值和方差中选出那个能使我们观测到这批数据的概率最大的均值和方差。也就是我们在做回归问题现在我们再看回归问题对于回归问题来说我们的目标不是去找一个x的正态分布了。对于一个回归问题我们以最简单的线性回归举例。对于一个回归问题我们的目标是 其中 和 是模型的参数而 是噪声我们假设噪声符合正态分布 。那么我们的 其实也可以看成符合正态分布并不是严谨的写法 其中 其实就是模型的预测值也就是说 。正态分布的probability density function是 带入得到402 Payment Required。那么也就是说如果我们想最大化我们观测到的 的情况的话我们应该最大化上面这个pdf的连乘结果。注意到这个值由一个常数乘上一个 的次方项优化的时候常数项可以忽略。于是我们的目标变成了 这里出现了连乘又出现了 的次方项很正常的想到取log于是变成了 忽略常数项稍微整理一下得到 402 Payment Required 。于是我们就证明了我们在做线性回归的时候我们如果假设我们的噪声符合高斯分布那么我们的目标函数就是MSE。总结很多时候一些基础知识可能会影响你对一个模型结果表现的理解如果对这种基础知识没有概念的话深度学习就变成了瞎调模型瞎调参数了。[另一篇博客][4]就提到了在做super resolution的时候如果用MSE做出来的图片会非常的模糊就是因为MSE是基于高斯分布假设最后的结果会尽可能地靠近高斯分布最高的地方使得结果不会太sharp。以后还是得适时提高深度学习的理论基础。后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群后台回复关键词【顶会】获取ACL、CIKM等各大顶会论文集 [1] CC思SS回归模型中的代价函数应该用MSE还是MAEhttps://zhuanlan.zhihu.com/p/45790146[2] 在回归问题中为何对MSE损失的最小化等效于最大似然估计https://www.zhihu.com/question/426901520[3] https://link.zhihu.com/?targethttps%3A//towardsdatascience.com/where-does-mean-squared-error-mse-come-from-2002bbbd7806[4] https://link.zhihu.com/?targethttps%3A//towardsdatascience.com/mse-is-cross-entropy-at-heart-maximum-likelihood-estimation-explained-181a29450a0b
http://www.pierceye.com/news/90135/

相关文章:

  • 宿州外贸网站建设公司工信部资质查询网站
  • 动漫做暧视频网站用手机制作动画的app
  • 网站备案 域名证书帝国cms响应式网站模板
  • 一个电信ip做网站卡不卡企业网站建设排名资讯
  • 网站建设论文的开题报告制作一个app软件需要多少时间
  • 我们做的网站是优化型结构做二手车网站需要什么
  • 湛江网站建设保定公司互联网信息服务平台官网
  • 做展柜平时在哪里网站推广网站色彩学
  • 网站建站 seo企业网站建设方案模板
  • 国外有哪些做deal的网站四川建筑职业学校官网教务网
  • 无锡网站制作工作室临夏州建设厅官方网站
  • 怎么建设淘宝联盟的网站150m网站空间
  • 淘宝联盟链接的网站怎么做的wordpress幻灯片教程视频教程
  • 网站上线稳定后工作wordpress 不同的文章
  • 网站制作一条龙淘宝详情页制作
  • 海南营销网站建设安徽省住房城乡建设厅网站
  • 单招网站开发基础知识厚街网站建设公司
  • 怎么建微信群如何完成seo优化
  • 顺义广州网站建设wordpress更改字体大小
  • 网站二级目录怎么做婚纱摄影类网站
  • 做国外销售都上什么网站制作图片视频
  • jsp网站开发教学视频教程网站做的比较好的
  • 网站上传页面手机网站与PC网站
  • 在线绘画网站推广链接打开
  • wordpress 企业站 模板做情书直接点网站
  • 在线解压rar网站永康市网站建设
  • 广州建站商城长链接转换成短链接
  • 专注网站平台推广公司陕西网站备案查询
  • 品牌网站建设的关键要点网页布局的目的
  • 昆明网站建设贴吧南昌房产网二手房出售信息