当前位置: 首页 > news >正文

河北手机网站建设上海网站seo招聘

河北手机网站建设,上海网站seo招聘,软件开发培训通知,响应式视频网站模板〇、两个预测任务 #xff08;1#xff09;任务一#xff1a;银行预测偿还能力 当前#xff0c;某银行正致力于发掘潜在的放贷用户。他们掌握了每位用户的三个关键特征#xff1a;房产状况、婚姻状况以及年收入。此外#xff0c;银行还拥有过往这些用户的债务偿还能力的…〇、两个预测任务 1任务一银行预测偿还能力 当前某银行正致力于发掘潜在的放贷用户。他们掌握了每位用户的三个关键特征房产状况、婚姻状况以及年收入。此外银行还拥有过往这些用户的债务偿还能力的数据。面对这一情境银行现需制定一套有效的策略用以评估新用户的偿债能力从而做出是否向其提供贷款的决策。 2任务二相亲优质男性 一位母亲想要为她的女儿介绍合适的男朋友女孩对此提出了四个明确的要求年龄、相貌、收入、公务员。她明确表示只有满足条件的男性她才愿意与之相亲。面对如此具体的条件母亲该如何在浩渺的婚恋市场中挑选出一位优质男性让女儿愿意与之相见呢 一、什么是决策树 相信你看到上面两个例子的时候心中已经有了一个判断。你是怎么做的判断呢我先来说说我是怎么做出决策的。将我所做的决策画成树这就被称为决策树。 1直观理解 对与任务一来说如果我是银行我肯定选择对有房子、结了婚、年收入高的人进行放贷。这里思考几个问题有房子难道就一定能还贷嘛万一他的房子很偏僻很小不值几个钱呢不结婚的人也许存款更多还款能力还强些呢到底怎么定义高收入呢 图1 对于任务二来说如果我是这个女孩儿我也许会选择年轻点的、长得还行就好、收入中等就行、最好是公务员。同样思考一下从我的决策中就能够看出有许多的模糊字眼。 图2 2定义 决策树是一种有监督学习算法通过特征选择和递归分割数据集构建树状模型用于分类或回归分析。其中每个内部节点代表一个特征测试分支表示不同的测试结果而叶节点则对应最终的类别或数值预测。分支节点又叫决策节点叶子节点又叫预测结果节点。 每个内部节点代表一个特征或属性测试。每个分支表示该特征可能的输出或取值。每个叶节点终端节点则代表一个决策结果或者分类标签在分类任务中对应某个类别的预测而在回归任务中叶节点会对应一个连续数值的预测。 二、不就是if-else语句吗怎么被称为机器学习模型 如果你也有这种疑问不妨回顾一下先前我们做的两个小预测任务上面提出了的思考问题可以总结为两个我们为什么会这样的特征来辅助决策以及我们要用怎样的阈值做为判断依据 决策树确实可以被视为一系列嵌套的if-else语句但其作为机器学习模型的意义在于这些if-else规则不是由人类程序员手动编写而是通过从训练数据中自动学习得出。在构建决策树的过程中特征的选择和阈值的确立都是根据优化准则自动生成的。 1该选哪些特征 在构建决策树时算法会遍历所有可能的特征并计算每个特征用于划分数据集时带来的信息增益、基尼不纯度或者其他类似的评价指标取决于所使用的具体算法。信息增益是衡量一个特征对分类纯度提升程度的一种量度而基尼不纯度则用来表示样本集合不确定性或随机性的大小。在每一轮迭代中算法会选择当前能够带来最大信息增益或最小基尼不纯度的特征作为节点来划分数据集。这样做的目的是逐步形成一个能最好地描述输入数据与输出类别之间关系的树状结构。 2该选哪个阈值 对于数值型特征来说在确定了使用该特征进行分割之后算法需要找到一个最优的阈值来划分数据。这个阈值通常是在当前特征的所有可能取值中搜索出来的使得基于此阈值划分数据后子集的信息增益或基尼不纯度达到最优。例如在CARTClassification and Regression Trees算法中对于连续特征会在特征的所有不同取值上尝试以找到最佳分割点。 三、决策树的优缺点 1优点 易于理解和解释决策树的结构直观且易于理解可以生成易于解释的规则对于非专业人士来说也很友好可以可视化展示整个决策过程。 可处理多种类型的数据无论是离散型、连续型还是混合型数据决策树都可以直接处理无需进行复杂的预处理。 能够处理缺失值在一定程度上决策树算法可以自动处理特征值缺失的情况通过特定策略如基于均值、中位数或众数填充来决定缺失值所在分支。 特征选择能力决策树能够对输入变量的重要性进行排序帮助识别哪些特征对预测结果影响最大。 并行性决策树训练过程中不同节点的划分可以相对独立地计算理论上支持并行化构建。 2缺点 过拟合问题决策树容易生成过于复杂的树结构导致过拟合训练数据不适用于未见过的新数据即泛化能力可能较差。 不擅长处理连续数值特征虽然决策树可以处理连续特征但在处理连续变量时可能不如其他模型如线性回归那样准确有效。 偏向于选择类别较多的特征决策树倾向于选择拥有更多类别的特征进行分割这可能导致忽略那些对决策真正重要的但类别较少的特征。 无法捕捉非线性关系和光滑边界对于数据分布较为复杂或者分类边界平滑的问题决策树的表现可能不尽如人意。 不稳定对于数据的小幅变动敏感尤其是当多个特征具有相近重要性时决策树的结果可能会因为样本顺序的变化而产生较大差异。 四、如何避免决策树的过拟合 避免决策树过拟合的主要策略包括 设置树的最大深度限制决策树的最大深度可以防止模型过于复杂减少节点划分的次数从而降低过拟合的风险。 最小样本数或叶子节点最少样本数要求每个内部节点或者叶子节点至少包含一定数量的样本这样可以防止在训练集上构建过度复杂的分支结构。 剪枝通过后剪枝或预剪枝的方法来简化决策树。后剪枝是先生成一颗完整的决策树然后从底部开始自下而上地删除对验证集性能改善不大的子树预剪枝则是在构建过程中每当扩展一个节点时都基于验证集的表现决定是否继续划分。
http://www.pierceye.com/news/589470/

相关文章:

  • 厦门市建设局思明建设分局官方网站在谷歌上做外贸网站有用吗
  • 网站开发手机自适应直接在原备案号下增加新网站
  • 公司网站建设安全的风险网络工程师app
  • 网站app封装怎么做电商网页
  • 网站文章做排名wordpress菜单文本
  • 建站哪家好社区个人网站模板 免费
  • 东西湖区建设局网站如何生成网址链接
  • wordpress商城视频教程苏州推广关键词优化
  • 网站游戏正规网站建设安卓系统软件开发培训机构
  • 关于网站集约化建设的讲话周口seo公司
  • 长沙做网站的公司哪家最好服务公司取名
  • 网站缩略图制作宁波商城网站建设
  • 公司网站公众号维护怎么做湖南网站建设
  • 商务网站建设实训结论装饰装修工程
  • dw做网站简单吗网络科技建设网站
  • 天台建设局网站wordpress编辑器没有16px
  • 携程网站建设计划管理与进度控制志鸿优化设计电子版
  • 网站一级域名和二级域名wordpress 插件 页面
  • 怎么做免费网站如何让百度收录网网站建设设计
  • 河北建设工程信息网官方网站证件在线制作免费
  • 推广网官方推广网站wordpress用户角色权限
  • 电子商务网站模板html淘宝网页版登录
  • 忆达城市建设游戏网站佛山市和城乡建设局网站
  • 备案后的域名改网站名青浦建设机械网站
  • 网站地图怎么做html网络营销论文2000字
  • 武进区城乡建设局网站组建网站建设团队
  • 做淘宝链接模板网站广安网站建设兼职
  • 受欢迎的网站建设平台有用的网站地址
  • 网站建设推广岗位网站建设法规
  • ftp两个网站子域名的绑定郑州网站推广公司