网站如何做微信支付宝支付宝,一级造价工程师通过率,wordpress没登录窗口,哪个网站做兼职可以赚钱目录
一、引入
二、基本术语
三、假设空间与归纳偏
四、模型选择 一、引入 机器学习#xff1a;通过计算手段#xff0c;得出具有能够自我修改、完善能力的模型#xff0c;利用经验改善系统自身性能。算法使用数据得到模型的过程即称为学习#xff0c;或训练 流程…目录
一、引入
二、基本术语
三、假设空间与归纳偏
四、模型选择 一、引入 机器学习通过计算手段得出具有能够自我修改、完善能力的模型利用经验改善系统自身性能。算法使用数据得到模型的过程即称为学习或训练 流程根据输入数据通过算法得到预测模型对目标进行预测 模型类别分为有监督学习和无监督学习其中有监督学习主要有分类和回归无监督学习有如聚类等。关于有监督学习和无监督学习可见另一篇文章
机器学习什么是监督学习和无监督学习-CSDN博客 得到模型之后即可进行预测会有用于测试的测试样本
二、基本术语 以例子的方式理解一些主要的术语现有一个问题如何判断一个西瓜是否是好瓜。取100个西瓜进行研究则 数据集这100个西瓜通过量来表示即可视为数据集数据集可分为训练集和测试集 训练集训练的过程使用的数据集。 测试集进行预测或测试使用的数据集。 一般机器学习的任务是希望通过对训练集进行学习建立一个从输入x到输出y的映射——fX-Y。在学到模型 f 后对测试集进行测试看这个模型训练的精度能够达到多少。 样本取其中部分西瓜进行研究可称为样本 属性又称特征描述事物在某个方面的具体表现常常在数据中的表现形式为数据集的某一列一个特征表示一列数据。 属性值又称特征值表示某样本在该属性上的具体取值比如西瓜的体积是 60cm³ 。这个“60cm³ ”在此处即是西瓜大小这一属性的取值 维度用于表示特征的多少如上面三个特征就是三维 属性空间又称样本空间属性张成的空间。是属性的所有可能取值组成的集合如果属性是多维度的则属性空间是多维度的集合。 例只有一个属性在该属性上的所有可能取值组成的集合 [123...] 构成一维属性空间若有多个维度如一个人的年龄身高体重构成一个属性空间为三维[[123...],[171,181,182,...],[140,152,110,...]] 特征向量使用西瓜三个特征——色泽根蒂敲声三个属性作为三个坐标轴每个西瓜对应一个空间点一个原点指向该点的坐标向量每个这种示例称为一个特征向量。 泛化能力算法对于未见过的新数据的预测能力
三、假设空间与归纳偏 假设空间由于机器学习是学习得到由输入到输出的映射或模型对于所有属性的所有取值会构成假设空间。如好西瓜问题的假设空间由“色泽XXX^根蒂XXX^敲声XXX”中所有可能的取值假设构成。 版本空间在过程中可以有许多策略对假设空间进行搜索例如自顶向下、从一般到特殊不断删除和正例不一致的假设、和与反例一致的假设最终将会获得与训练集相匹配即所有训练样本基本都能够判断正确的假设这些假设构成版本空间。 如上述假设空间中满足“是好西瓜”的特征的假设构成版本空间 归纳偏好假如现在版本空间中有三个与训练集相匹配的假设但是对应的模型在遇到一个新问题时可能会产生不同的预测结果。那么应该如何选择这时学习算法本身的“偏好”就会起到决定性作用。机器学习算法在学习过程中对某种类型假设的偏好称为“归纳偏好”。简单来说就是对哪一个特征或模型更相信可看作学习算法本身在一个有可能很庞大的假设空间中的“价值观”。 关于这几个概念可以看一下这个例子
西瓜书《机器学习》阅读笔记1——Chapter1_假设空间_机器学习周志华,西瓜问题假设空间微为65怎么计算的-CSDN博客 如何来引导算法树立正确的偏好或者说如何选择合适的模型呢
四、模型选择 两个重要原则 原理1奥卡姆剃刀如无必要勿增实体。即若有多个假设与研究结果一致选择最简单的 原理2NFL原理没有免费午餐原理若学习算法 A 在某些问题上比学习算法 B 要好那么必然存在另一些问题在这些问题中比 A 表现更好。原理之类的感兴趣朋友可以看看↓
机器学习周志华--没有免费的午餐定理_机器学习的没有免费的午餐的公式证明-CSDN博客