当前位置: 首页 > news >正文

中国站长之家网站怎么下载电脑本机wordpress

中国站长之家网站,怎么下载电脑本机wordpress,关于农产品电子商务网站的建设,郑州最好的男科医院是什么医院原文链接#xff1a;https://zhuanlan.zhihu.com/p/26539920 Learning to rank基本算法小结最近工作中需要调研一下搜索排序相关的方法#xff0c;这里写一篇水文#xff0c;总结一下几天下来的调研成果。包括Learning to rank 基本方法Learning to rank 指标介绍LambdaMART…原文链接https://zhuanlan.zhihu.com/p/26539920 Learning to rank基本算法小结最近工作中需要调研一下搜索排序相关的方法这里写一篇水文总结一下几天下来的调研成果。包括Learning to rank 基本方法Learning to rank 指标介绍LambdaMART 模型原理FTRL 模型原理Learning to rank排序学习是推荐、搜索、广告的核心方法。排序结果的好坏很大程度影响用户体验、广告收入等。排序学习可以理解为机器学习中用户排序的方法这里首先推荐一本微软亚洲研究院刘铁岩老师关于LTR的著作Learning to Rank for Information Retrieval书中对排序学习的各种方法做了很好的阐述和总结。我这里是一个超级精简版。排序学习是一个有监督的机器学习过程对每一个给定的查询文档对抽取特征通过日志挖掘或者人工标注的方法获得真实数据标注。然后通过排序模型使得输入能够和实际的数据相似。常用的排序学习分为三种类型PointWisePairWise和ListWise。PointWise单文档方法的处理对象是单独的一篇文档将文档转换为特征向量后机器学习系统根据从训练数据中学习到的分类或者回归函数对文档打分打分结果即是搜索结果PointWise方法很好理解即使用传统的机器学习方法对给定查询下的文档的相关度进行学习比如CTR就可以采用PointWise的方法学习但是有时候排序的先后顺序是很重要的而PointWise方法学习到全局的相关性并不对先后顺序的优劣做惩罚。PairWise对于搜索系统来说系统接收到用户査询后返回相关文档列表所以问题的关键是确定文档之间的先后顺序关系。单文档方法完全从单个文档的分类得分角度计算没有考虑文档之间的顺序关系。文档对方法将排序问题转化为多个pair的排序问题比较不同文章的先后顺序。但是文档对方法也存在如下问题文档对方法考虑了两个文档对的相对先后顺序却没有考虑文档出现在搜索列表中的位置排在搜索结果前面的文档更为重要如果靠前的文档出现判断错误代价明显高于排在后面的文档。同时不同的査询其相关文档数量差异很大所以转换为文档对之后 有的查询对能有几百个对应的文档对而有的查询只有十几个对应的文档对这对机器学习系统的效果评价造成困难常用PairWise实现SVM RankRankNet(2007)RankBoost(2003)ListWise:单文档方法将训练集里每一个文档当做一个训练实例文档对方法将同一个査询的搜索结果里任意两个文档对作为一个训练实例文档列表方法与上述两种方法都不同ListWise方法直接考虑整体序列针对Ranking评价指标进行优化。比如常用的MAP, NDCG。常用的ListWise方法有LambdaRankAdaRankSoftRankLambdaMARTLearning to rank指标介绍MAP(Mean Average Precision):假设有两个主题主题1有4个相关网页主题2有5个相关网页。某系统对于主题1检索出4个相关网页其rank分别为1, 2, 4, 7对于主题2检索出3个相关网页其rank分别为1,3,5。对于主题1平均准确率为(1/12/23/44/7)/40.83。对于主题2平均准确率为(1/12/33/500)/50.45。则MAP (0.830.45)/20.64。NDCG(Normalized Discounted Cumulative Gain):NDCG把相关度分为r个等级如果r5等级设定分别文2^5-12^4-1等等那么加入现在有一个query为abc 返回如下图所示的列表假设用户选择和排序结果无关则累积增益值如右列所示考虑到靠前的位置点击概率越大那么靠下的位置需要加上衰减因子log2/log(1j)求和就可以得到DCG的值最后为了使得不同不搜索结果可以比较用DCG/MaxDCG就可以得到NDCG的值了。MaxDCG就是当前情况下最佳排序的DCG值。如图所示MaxDCG就是1、3、4、5、2的排序情况下的DCG的值(rank 2的gain较低应该排到后面NDCG值MRR(Mean Reciprocal Rank)给定查询qq在相关文档的位置是r那么MRR(q)就是1/RLambdaMART算法LambdaMART是Learning to rank其中的一个算法在Yahoo! Learning to Rank Challenge比赛中夺冠队伍用的就是这个模型。LambdaMART模型从名字上可以拆分成Lambda和MART两部分训练模型采用的是MART也就是GBDTlambda是MART求解使用的梯度其物理含义是一个待排序文档下一次迭代应该排序的方向。但Lambda最初并不是诞生于LambdaMART而是在LambdaRank模型中被提出而LambdaRank模型又是在RankNet模型的基础上改进而来。所以了解LambdaRank需要从RankNet开始说起。论文From RankNet to LambdaRank to LambdaMART: AnOverviewRankNetRankNet是一个pairwise模型上文介绍在pairwise模型中将排序问题转化为多个pair的排序问题比较文档di排在文档dj之前的概率。如下图所示最终的输出的sigmoid函数RankNet采用神经网络模型优化损失函数故称为RankNet。可是这样有什么问题呢排序指标如NDCG、MAP和MRR都不是平滑的函数RankNet的方法采用优化损失函数来间接优化排序指标。LambdaRank如图所示蓝色表示相关的文档灰色表示不相关的文档。RankNet以pairwise计算cost左边为13右图将第一个文档下调3个位置将第二个文档下调5个位置cost就降为11。如此以来虽然RankNet的损失函数得到优化但是NDCG和ERR等指标却下降了。RankNet优化的方向是黑色箭头而我们想要的其实是红色的箭头。LambdaRank就是基于这个其中lambda表示红色箭头。LambdaRank不是通过显示定义损失函数再求梯度的方式对排序问题进行求解而是分析排序问题需要的梯度的物理意义直接定义梯度Lambda梯度由两部分相乘得到(1)RankNet中交叉熵概率损失函数的梯度(2)交换UiUj位置后IR评价指标Z的差值。具体如下lambdaMART我们知道GBDT算法每一次迭代中 需要学习上一次结果和真实结果的残差。在lambdaMART中每次迭代用的并不是残差lambda在这里充当替代残差的计算方法。LambdaMART算法流程GBDT算法流程对比lambdaMART和GBDT算法流程主要框架是相同的只不过LambdaMART模型用lambda梯度代替了GBDT的残差。FTRL算法Follow the regularized Leader Proximal论文 Ad click prediction: a view from the trenches点击率预估问题CTR是搜索、广告和推荐中一个非常重要的模块。在CTR计算的过程中常常采用LR模型。FTRL属于在线算法和SGD等常用的在线优化方法对比可以产生较好的稀疏性非常适合ID特征较多维度较高的特征。google的论文中已经给出了很详细的工程化实现的说明该方法也已经广泛的应用。参数优化第一项保证参数不偏移历史参数第二项保证w不会变化太大第三项代表L1正则获得稀疏解算法流程编辑于 2017-04-25数据挖掘机器学习计算广告学​赞同 356​​27 条评论​分享​收藏​赞同 356​分享
http://www.pierceye.com/news/236255/

相关文章:

  • 深圳网站设计工作室广告公司名字 三个字
  • 长沙门户网站广告网站设计公司
  • 余姚网站建设的公司wordpress 开发文档
  • 怎么建设一个微信网站莱芜金点子最新招工信息
  • 石家庄网站排名优化wordpress修改布局
  • 景安服务器管理助手如何备份网站国外做图标网站
  • 网站轮播怎么做石家庄网站建设规划
  • 免费软件网站下载深圳网站开发哪个公司好
  • 建设项目验收网站公示内网门户网站建设方案
  • 滨海做网站哪家最好宝安附近做网站公司
  • 详情页的五大模块东莞网站优化科技有限公司
  • 南阳建设网站哪家好昆明网站服务
  • 大潮建设集团有限公司 网站网站改版策划方案
  • 网站开发心路历程烟台网站建设薇企汇互联见效付款
  • 企业网站的制作周期wordpress添加数据库表
  • 广告推广营销网站网站买空间的价格
  • 转转假网站怎么做linux建设视频网站
  • 伍佰亿搜索引擎网站系统wordpress 增加备案
  • 韩国做游戏的电影 迅雷下载网站有哪些网络营销方式文献
  • 大学生兼职网站的融资方案龙华网站建设设计制作公司
  • 青之峰网站建设哪家好用什么l软件做网站了
  • 免费建站资源怎么编写app软件
  • 机关网站建设建议云南响应式网站建设
  • 对网站开发语言的统计杭州网站设计公司有哪些
  • 不会代码 怎么做网站兴义网络推广
  • 综合电子商务型企业网站怎么做网站的网盘
  • ucenter使用自己做的网站房地产新闻时事热点
  • 企业网站备案 过户电商运营视频教程
  • 做网站运营这工作怎么样北京网站优化价格
  • 河南专业网站建设网站怎么做高权重