当前位置: 首页 > news >正文

长治做网站哪家好赣州注册公司

长治做网站哪家好,赣州注册公司,源码市场,wordpress恢复数据库总结 本系列是机器学习课程的系列课程#xff0c;主要介绍机器学习中分类算法#xff0c;本篇为分类算法开篇与决策树部分。 本门课程的目标 完成一个特定行业的算法应用全过程#xff1a; 懂业务会选择合适的算法数据处理算法训练算法调优算法融合 算法评估持续调优工程…总结 本系列是机器学习课程的系列课程主要介绍机器学习中分类算法本篇为分类算法开篇与决策树部分。 本门课程的目标 完成一个特定行业的算法应用全过程 懂业务会选择合适的算法数据处理算法训练算法调优算法融合 算法评估持续调优工程化接口实现 机器学习定义 关于机器学习的定义Tom Michael Mitchell的这段话被广泛引用 对于某类任务T和性能度量P如果一个计算机程序在T上其性能P随着经验E而自我完善那么我们称这个计算机程序从经验E中学习。 分类方法的定义 决策树算法 什么是好瓜 熵的概念来源于热力学。在热力学中熵的定义是系统可能状态数的对数值称为热熵。它是用来表达分子状态杂乱程度的一个物理量。热力学指出对任何已知孤立的物理系统的演化热熵只能增加不能减少。 信息的基本作用就是消除人们对事物了解的不确定性。美国信息论创始人香农发现任何信息都存在冗余冗余的大小与信息的每一个符号出现的概率和理想的形态有关。信息熵表示的是信息的混乱程度。当均匀分布时信息熵最大。当熵除一个值之外其他值均为0信息熵最小。 和热力学中的熵相反的是信息熵只能减少不能增加。 所以热熵和信息熵互为负量。且已证明任何系统要获得信息必须要增加热熵来补偿即两者在数量上是有联系的。 信息熵信息量的量化过程 例如 事件A明天的太阳会从东边升起。 事件B虽然明天的太阳还是从东边升起但是明天要下雪。 信息量没有量化 信息量的表达式应该满足的条件 1信息量和事件发生的概率有关当事件发生的概率越低或者越高传递的信息量越大 2信息量应当是非负的必然发生的信息量为0 3两个事件的信息量可以相加并且两个独立事件的联合信息量应该是他们各自信息量的和 信息熵的量化过程 熵随着概率的变化为 信息增益的计算 信息增益信息熵-条件熵 g(D,A)H(D) –H(D|A) 条件熵是另一个变量Y熵对X条件的期望。 信息增益(Information Gain)熵A-条件熵B是信息量的差值。也就是说一开始是用了条件后变成了则条件引起的变化是A-B即信息增益。好的条件就是信息增益越大越好。因此我们在树分叉的时候应优先使用信息增益最大的属性这样降低了复杂度也简化了后边的逻辑。 比如下面数据 初始的信息熵H(A)为 一共12人嫁的有6人不嫁的有6人 H(A) -1/2 * log1/2 -1/2 * log1/2-log1/2 可以得出 当已知不帅的条件下满足条件的只有4个数据了这四个数据中不嫁的个数为1个占1/4嫁的个数为3个占3/4 那么此时的 HY|X 不帅 -1/4log1/4 - 3/4log3/4 p(X 不帅) 4/12 1/3 同理我们可以得到 当已知帅的条件下满足条件的有8个数据了这八个数据中不嫁的个数为5个占5/8 嫁的个数为3个占3/8 那么此时的 HY|X 帅 -5/8log5/8 - 3/8log3/8 p(X 帅) 8/12 2/3 计算结果 有了上面的铺垫之后我们终于可以计算我们的条件熵了我们现在需要求 HY|X 长相 也就是说我们想要求出当已知长相的条件下的条件熵。 根据公式我们可以知道长相可以取帅与不帅俩种然后将上面已经求得的答案带入即可求出条件熵 HY|X长相 p(X 帅)*HY|X帅p(X 不帅)*HY|X不帅 2/3 * (-5/8log5/8 - 3/8log3/8) 1/3 *(-1/4log1/4 - 3/4log3/4) 此时的信息增益计算为 g(D,A) H(D) –H(D|A) -log1/2 - (2/3 * (-5/8log5/8 - 3/8log3/8) 1/3 *(-1/4log1/4 - 3/4log3/4)) 其实条件熵意思是按一个新的变量的每个值对原变量进行分类比如上面这个题把嫁与不嫁按帅不帅分成了俩类。 然后在每一个小类里面都计算一个小熵然后每一个小熵乘以各个类别的概率然后求和。 我们用另一个变量对原变量分类后原变量的不确定性就会减小了因为新增了X的信息可以感受一下。不确定程度减少了多少就是信息的增益。 再举一个例子 如果采用苹果编号为条件会发现此时信息增益最大因为编号1的叶子节点只有yes此时的信息熵为0最后会导致信息增益会选择苹果编号为分割条件。 举例 信息增益率的计算 基尼系数的计算 ID3 C4.5 CART算法比较 决策树——ID3和C4.5理论图解公式推导 策略产品经理必读系列—第七讲ID3、C4.5和CART算法详解 决策树一| 基础决策树 ID3、C4.5、CART 核心概要 确定方向过程 针对完全没有基础的同学们 1.确定机器学习的应用领域有哪些 2.查找机器学习的算法应用有哪些 3.确定想要研究的领域极其对应的算法 4.通过招聘网站和论文等确定具体的技术 5.了解业务流程查找数据 6.复现经典算法 7.持续优化并尝试与对应企业人员沟通心得 8.企业给出反馈
http://www.pierceye.com/news/766266/

相关文章:

  • 网站开发从入门到精通做h5的网站哪个好
  • 免费公司网站如何建立设计个人网站好备案吗
  • 建网站和做微信哪个好在线识别图片百度识图
  • php网站开发如何实现删除功能大连大连建设工程信息网站
  • 表格模板免费下载网站wordpress 插件位置
  • wordpress小白能学会吗汕头做网站优化公司
  • 军队营房基础建设网站重庆做网站个人
  • 网站建设怎样中英文网站备案是空间备案还是域名备案
  • 陕西网站制作人力资源服务外包
  • 成都网站建设哪家售后好网站建设费可以计业务费吗
  • 做服装到哪个网站拿货品质好自己制作的网页别人如何访问
  • 榆林哪里做网站网页游戏网站那个好
  • 泰安口碑好的企业建站公司wordpress验证码无效
  • 圣矢网络重庆网站建设优化推广公司好听好记的网站域名
  • 如何做旅游小视频网站比较好的外贸公司
  • 图书馆建设投稿网站使用 ahrefs 进行 seo 分析
  • 校园网站建设 德育免费换ip软件
  • 排行网站模板凡科代理千万不要做
  • 贵州省冶金建设有限公司网站网站好玩新功能
  • 怎么让客户做网站惠州关键词排名提升
  • 创建公司网站需要什么国外的智慧城市建设网站
  • 阿里云服务器做网站django高清无版权网站
  • 网页制作与网站制作wordpress二次元风格
  • 贵州省城乡建设局网签网站工业设计网站有那些
  • 网站 电信已备案 联通泗阳做网站设计
  • 胶州做淘宝的网站龙南黄页全部电话
  • 可以看网站的手机浏览器藁城住房和城乡建设局网站
  • 关于网站制作的指标哪家公司网站做的比较好
  • 网站开发一般多少钱规划设计公司毛利
  • .net 网站地图高端网站建设 n磐石网络