当前位置: 首页 > news >正文

visual studio网站开发教程天津专业的做网站与运营的公司

visual studio网站开发教程,天津专业的做网站与运营的公司,湖南做网站seo,品牌营销策略案例目录 树模型与集成学习 LightGBM 的贡献 LightGBM 的贡献#xff1a;单边梯度抽样算法 LightGBM 的贡献#xff1a;直方图算法 LightGBM 的贡献#xff1a;互斥特征捆绑算法 LightGBM 的贡献#xff1a;深度限制的 Leaf-wise 算法 树模型与集成学习 树模型是非常好的… 目录 树模型与集成学习 LightGBM 的贡献 LightGBM 的贡献单边梯度抽样算法 LightGBM 的贡献直方图算法 LightGBM 的贡献互斥特征捆绑算法 LightGBM 的贡献深度限制的 Leaf-wise 算法 树模型与集成学习 树模型是非常好的基学习器弱学习器。 如何结合多颗树完成模型构建呢 Random Forest: Bagging Decision Tree GBDT: Gradient Boost Decision Tree 将树模型和集成学习进行结合的想法是可行的。 比如如果我们将 Bagging 和 Decision Tree 思路进行结合在进行训练的时候我们训练多棵树每棵树使用具体的不同的数据那么这样就是随机森林的思路。如果我们将 Gradient Boost 和 Decision Tree 思路进行结合那么就是 GBDT 的思路。 随机森林是基于 Bagging 的思路对数据集进行有放回的采样构建不同的数据集然后从数据集里面训练得到不同的模型最终完成投票或者是加权求和。 在竞赛的过程中我们一般情况下是不会去使用随机森林我们现在会直接使用比较高阶的一些树模型比如 XGBoostLightGBM 或 CatBoost。 LightGBM 的贡献 LightGBM 的特点或贡献主要有如下几点。 单边梯度抽样算法 直方图算法 互斥特征捆绑算法 深度限制的 Leaf-wise 算法 类别特征最优分割 特征并行和数据并行 缓存优化。 LightGBM 的贡献单边梯度抽样算法 对样本进行采样选择部分梯度小的样本 让模型关注梯度高的样本减少计算量。 首先来看单边梯度抽样算法我们在进行训练的过程中可能会计算具体的逻辑 function然后可以得到具体的梯度信息。我们在进行选择的过程中会剔除梯度比较小的样本也就是说我们会让模型关注梯度比较高的一些样本这样可以减少模型的计算量加速训练。 如图是来自于原始论文中的 LightGBM 的伪代码它的具体的特征是由梯度比较强的一部分样本和梯度比较弱的一部分样本这两部分组成的。 LightGBM 的贡献直方图算法 将连续特征离散化用直方图统计信息 对内存、速度都友好。 第二个是直方图算法它是 LightGBM 提出伊始的一种非常惊艳的算法。在使用树模型的时候我们的类别特征需不需要做 onehot 呢其实在 LightGBM 被提出来之前一般情况还是建议做 onehot 的也就是说在使用 XGBoost 的时候是建议做 onehot 然后再做训练的。但是现在 LightGBM 的原始论文中使用了直方图的算法来将连续特征做离散化。在 2017 年第一版本的 LightGBM 提出的时候它的直方图的算法已经比 XGBoost 快很多了。 LightGBM 直方图算法的连续特征离散化特征是将具体的连续特征用直方图去做一个相当于分箱的过程。分箱是把具体的连续分布划分成不同的单元格然后从单元格的角度去进行节点的划分。如图是它的具体的伪代码。 它的伪代码对于每个特征去构建一个直方图然后再去从直方图里面找到最优的分裂节点。 LightGBM 的贡献互斥特征捆绑算法 使用互斥捆绑算法将特征绑定降低复杂度 将特征绑定视为图着色问题计算特征之间的冲突值 将特征增加增加偏移量然后一起相加分桶。 LightGBM 也支持互斥捆绑的过程。我们在进行迭代的过程中其实是可以将特征进行绑定以此来降低模型的复杂度的。但是在绑定的过程中其实是有一个搜索过程的LightGBM 把搜索过程视为图着色问题然后去计算特征之间的冲突值。LightGBM 将两个特征的直方图进行相加组成为一个新的直方图然后在新的直方图中找到分裂节点它的核心的仍然是基于直方图的操作。 LightGBM 的贡献深度限制的 Leaf-wise 算法 每次分裂增益最大的叶子节点直到达到停止条件 限制树模型深度每次都需要计算增益最大的节点 LightGBM 还有一个贡献就在于它是基于 Leaf-wise 的节点分裂。我们在进行节点分裂的过程中会设置树模型的最大深度这是我们在一些机器学习模型里面需要设置的超参数。LightGBM 在分裂的过程中不是逐层进行具体的划分的它是在进行节点分裂的过程中选择分裂增益最大的叶子节点然后再进行分裂而且它限制了具体的树模型的深度这样能够避免模型的过拟合。
http://www.pierceye.com/news/705906/

相关文章:

  • 上市设计网站软件商城官网
  • 网站建设是什么科目查找5个搜索引擎作弊的网站
  • 佛山市锵美装饰有限公司网站建设案例微信商城小程序开发一般需要多少钱
  • 成都网站定制中心知名的中文域名网站有哪些
  • 福州长乐网站建设网站流量统计分析
  • 四川网站建设公司 登录六盘水市诚信网站建设公司
  • 优秀包装设计网站软件工程师工作
  • 舟山建设信息港网站泉州百度网络推广
  • 网站流量宝镜像别人网站做排名的好处
  • 如何学习网站建设app网络营销方案设计题
  • 高端品牌网站建设明细报价报腾讯云 win wordpress
  • 云南建设网站网站建设公司现在还挣钱吗
  • 濮阳微信网站建设没有数据库的网站
  • 网站开发与没计是做什么贵阳查房子备案的网站
  • 做网站学不需要做后台管理系统mean网站开发
  • 网页网站公司如何做备份游戏型网站开发
  • 网站排名必做阶段性seo策略软文写作是什么意思
  • 网站域名商渭南哪家公司可以做网站
  • 医院网站asp源码加强机关网站建设
  • wordpress建手机站网站建设规划大纲
  • 同个主体新增网站备案施工企业副总经理竞聘
  • 视频网站后台设计针式个人知识库管理系统
  • 外围网站开发网页制作对联
  • 深圳福永网站建设网站多个用户怎样建设
  • 百度网站排名怎么提高wordpress页面全屏的插件
  • 企业网站优化方式wordpress 外链播放器
  • 设计衣服的网站久久诗歌网
  • 上海网站营销it运维网
  • 一起做网店广州站怎么推广软件让别人下载
  • 王晴儿网站建设方案wordpress媒体库 ftp