当前位置: 首页 > news >正文

公共建设工程中心网站wordpress hotlink protection

公共建设工程中心网站,wordpress hotlink protection,没注册过wordpress有账号,怎么登陆wordpress一、优化思路梳理 课前准备   在昨天的内容中#xff0c;我们通过使用更强的集成模型以及模型融合的方法#xff0c;已经顺利将比赛分数提高至前20%。但正如此前所说#xff0c;之前的一系列操作只不过是遵循了常规操作流程进行的数据处理与建模#xff0c;若希望能够更进…一、优化思路梳理 课前准备   在昨天的内容中我们通过使用更强的集成模型以及模型融合的方法已经顺利将比赛分数提高至前20%。但正如此前所说之前的一系列操作只不过是遵循了常规操作流程进行的数据处理与建模若希望能够更进一步提高模型分数则需要因地制宜、活学活用在考虑到当前数据及特殊情况下进行有针对性的策略调整。本节内容我们将结合此前搜集到的所有数据集信息及业务背景信息进行最后一轮的特征优化与模型优化并最终将排名提升至前1%。 当然这个过程并不简单若需要跟上本节内容的讨论需要非常熟悉当前数据集的基本情况也就是需要深度掌握Day1-2所介绍内容从而才能理解接下来的特征优化相关内容此外也需要对Day 5中介绍的集成学习建模策略即在使用原生算法库情况下如何配合交叉验证过程、借助贝叶斯优化器进行超参数搜索并最终输出交叉验证的测试集预测均值作为最终预测结果的一整个流程从而才能更快速的理解本节开始我们对模型训练流程进行的优化与调整此外我还将在本节介绍非常适用于竞赛场景的融合技巧亦可作为同学日后参与竞赛时的有力工具。不过没有跟上此前的内容的同学也不用担心本节内容将更加强调优化过程的整体逻辑并尽可能从一个更加通俗且准确的角度进行解释大家也可以在听完本节内容后再去回顾此前Day1-5的相关内容以终为始、未尝不可通过反复观看也相信大家会对本节内容有一个更深刻的理解。 整体优化思路   对于机器学习来说总的来看有两种建模思路其一是通过特征工程方法进一步提升数据质量其二则是通过更加复杂的模型或更加有效的模型融合技巧来提升建模效果并且就二者的关系来看正如时下流行的观点所说特征工程将决定模型效果上界而建模过程则会不断逼近这个上界。但无论如何在优化的过程中需要二者配合执行才能达到更好的效果。 image-20211210125340547 1.特征优化思路   首先先来看特征优化思路。在此前的建模过程中我们曾不止一次的对特征进行了处理首先是在数据聚合时以card_id进行聚合为了尽可能提取更多的交易数据信息与商户信息带入进行模型我们围绕交易数据表和商户数据表进行了工程化批量特征衍生彼时信息提取流程如下 该过程的详细讲解可参考Day 3-Day 4的课程内容。总而言之通过该过程我们顺利的提取了交易信息表和商户信息表中的数据带入进行建模并且借助随机森林模型顺利跑通Baseline。但值得一提的是在上述流程中我们其实只是采用了一些工程化的通用做法这些方法是可以快速适用于任何数据集的特征衍生环节同时这样的方法也应该是所有建模开始前必须尝试的做法但既然是“通用”方法那必然无法帮我们在实际竞赛中脱颖而出。 当然我们也曾尝试过进行有针对性的特征优化在Day 5的内容中我们曾采用NLP方法用于提取特征ID列的信息并得到了一系列能够更加细致描述用户行为信息与商品偏好的特征借助该特征我们最终训练得出了一个效果更好的模型该结果也进一步验证了特征优化对模型效果提升所能起到的作用。接下来我怕们也将尝试进一步进行有针对性的特征优化。 总体来看特征优化需要结合数据集当前的实际情况来制定在已有批量衍生的特征及NLP特征的基础上针对上述数据集还可以有以下几点优化方向 用户行为特征   首先我们注意到每一笔信用卡的交易记录都有交易时间而对于时间字段和文本字段普通的批量创建特征的方法都是无法较好的挖掘其全部信息的因此我们需要围绕交易字段中的交易时间进行额外的特征衍生。此处我们可以考虑构造一些用于描述用户行为习惯的特征经过反复验证用户行为特征是最为有效的提高预测结果的特征类包括最近一次交易与首次交易的时间差、信用卡激活日期与首次交易的时间差、用户两次交易平均时间间隔、按照不同交易地点/商品品类进行聚合并统计均值、方差等统计量。   此外我们也知道越是接近当前时间点的用户行为越有价值因此我们还需要重点关注用户最近两个月实际时间跨度可以自行决定的行为特征以两个月为跨度进一步统计该时间周期内用户的上述交易行为特点并带入模型进行训练。 二阶交叉特征   在此前的特征衍生过程中我们曾进行了交叉特征衍生但只是进行了一阶交叉衍生例如交易额在不同商品上的汇总但实际上还可以进一步构造二阶衍生例如交易额在不同商品组合上的汇总。通常来说更高阶的衍生会导致特征矩阵变得更加稀疏并且由于每一阶的衍生都会创造大量特征因此更高阶的衍生往往也会造成维度爆炸因此高阶交叉特征衍生需要谨慎。不过正如此前我们考虑的由于用户行为特征对模型结果有更大的影响因此我们可以单独围绕用户行为数据进行二阶交叉特征衍生并在后续建模前进行特征筛选。 异常值识别特征   在Day 1的数据探索中我们就发现训练数据集的标签中存在少量极端异常值的情况
http://www.pierceye.com/news/113746/

相关文章:

  • 门户网站建设汇报如果在网上接网站建设项目
  • 网站开发文档是什么概念注册个体户
  • 双井做网站的公司app开发和网站开发价格
  • 电梯企业网站制作中山网站建设电话
  • 做网站推广哪些跨境电商平台企业
  • 域名注册网站推荐方案模板
  • 亚运村网站建设北京工商注册官网
  • sql2005做网站书店网站建设人员分配
  • 工商局网站怎么做股东实名认证石家庄网站建设公司怎么样
  • 做公众号的模版的网站国内网站做国外服务器
  • 做国际网站的上海高端网站公司wordpress 4.9.6 下载
  • 学校集约网站建设最牛餐饮营销手段
  • wordpress影视站网站太花哨
  • 青岛 机械 中企动力提供网站建设小说网站怎么做空间小
  • 通江县网站建设做网站到八方资源网怎么样
  • 国家网站建设ssh架构jsp网站开发
  • 浦东新区手机网站设计网络营销做得好的产品
  • 浙江市建设网站市场监督管理局电话举报电话
  • 企业网站的建设的功能定位菏泽百度推广公司电话
  • linux系统怎么做网站女生去住建局好不好
  • 自己搭建环境建设网站网站开发温州
  • 下沙做网站软件erp系统的主要功能
  • 郑州网站建设专家最新手机排行榜2021
  • 宠物店网站建设策划书重庆网站建设 红旗河沟
  • 一般网站自己可以做播放器吗最简单的一个网站开发
  • 网站的开发商务网站安全方案设计
  • 如何建立网站教材漳诈网站建设
  • 开家网站设计公司广州网站建设app开发
  • 建站服务公司网站源码成都游戏外包公司排名
  • 呼伦贝尔网站建设呼伦贝尔astro wordpress