一家只做卫生巾的网站,河北青山建设集团有限公司网站,设计公司画册模板,上传附件空间网站1.什么是决策树#xff1f;
决策树是一类常见的机器学习方法#xff0c;决策树是基于树的结构来进行决策。决策过程中提出的每一个问题都是对于属性的“测试”#xff0c;决策的最终结论对应了我们希望的判定结果。一个决策树包含一个根节点#xff0c;若干个内部节点和若…1.什么是决策树
决策树是一类常见的机器学习方法决策树是基于树的结构来进行决策。决策过程中提出的每一个问题都是对于属性的“测试”决策的最终结论对应了我们希望的判定结果。一个决策树包含一个根节点若干个内部节点和若干个叶子节点。其中叶子节点对应于决策结果其他每一个节点对应于一个属性测试。每个结点对应的样本集合根据属性测试被划分到子节点中流程遵循递归“分而治之”divide-and-conquer的策略。引用《机器学习》西瓜书的图片 2. 什么是信息熵information entropy?
是度量样本集合纯度purity的一种指标信息熵越小集合纯度越高。对于集合D的信息熵计算公式如下其中pk是集合中第k类样本所占的比例 3.什么是信息增益information gain?
信息增益越大意味着使用属性a所划分获得的纯度提升越大。一般决策树的结点选择当前信息增益最大的属性作为划分结点公式如下其中Dv表示D中所有在属性a上取值为av的样本 4.什么是增益率gain ratio
信息增益对可取值数目较多的属性有所偏好为了减少这种偏好带来的不利影响。引入了增益率增益率对可取值数目较少的属性有所偏好。增益率准则使用的时候先选择高于平均信息增益水平的attribute然后再从中选择增益率最高的。 5.什么是剪枝pruning
剪枝是决策树解决过拟合的一种方法通过主动去掉一些分支来解决过拟合的风险。基本策略有预剪枝pre-pruning和后剪枝post-pruning。预剪枝是基于信息增益准则我们首先要选择一个信息增益高的结点进行划分预剪枝要使用性能评估方法对划分前后的泛化性能进行估计。后剪枝是先从训练集生成一棵完整的决策树然后自底向上对所有结点进行逐一考查训练时间开销比未剪枝和预剪枝都大。
6.什么是神经网络neural network
神经网络是具有适应性的简单单元组成的广泛并行互联的网络它的组织能够模拟真实神经系统对现实世界做出的反应是一个包含很多参数的数学模型。神经网络的学习过程就是根据训练数据来调整神经元之间的“连接权”connection weight以及每一个功能神经元的阈值。
7.什么是感知机perceptron
感知机由输入层神经元和输出层神经元组成输入层接收外界信号传递给输出层输出层是M-P神经元。感知机只有输出层是功能神经元function neuron即只有输出层用激活函数进行处理。若感知机预测正确则 不修改否则 按照学习率进行修改。感知机只能处理线性可分问题linearly neuron如果是线性可分问题那么感知机的学习过程一定会收敛converge否则感知机的学习过程会发生振荡fluctuation即 不会收敛成为一个稳定的向量。
8.什么是多层前馈神经网络multi-layer feedforward neural network
是一种常见的神经网络每一层神经元与下一层神经元互连神经元之间不存在同层连接也不存在跨层连接。其中输入层接收神经元输入隐含层hidden layer和输出层神经元对信号进行最终加工激活函数最终结果由输出层神经元输出。