我们的优势的网站,开发网站年度工作总结及明年工作计划,怎样做网站代理,wordpress lophita机器学习之扫盲导论篇来都来了#xff0c;不关注一下吗#xff1f;#xff1f;人工智能是当下最火的词#xff0c;而机器学习就是它的灵魂。现在超级多搞金融的人已经用到很深的机器学习模型了#xff0c;更别提互联网企业的大佬们了#xff0c;比如#xff1a;(这是一篇… 机器学习之扫盲导论篇来都来了不关注一下吗 人工智能是当下最火的词而机器学习就是它的灵魂。 现在超级多搞金融的人已经用到很深的机器学习模型了更别提互联网企业的大佬们了比如 (这是一篇研报) (这真的是某券商金工团队出的一篇研报) 更夸张的是发现我校的“信息xxxx学院”在几年前偷偷改名为“人工智能学院”(还是我走夜路偶然发现的抓住你了)exmmmm 足以说明它的火爆程度 那么就别躲着着了赶紧上车跟上这波潮流。让我们大声喊出口号: “机器学习没有你想象的那么难。” 机器学习(Machine learning)是一门科学准确的来说是一门关于算法的科学。 那么统计机器学习大致分为四类监督学习、无监督学习、半监督学习和强化学习。下面一一来为大家扫个盲。1监督学习 监督学习(supervised learning)是指从标注数据中学习预测模型的机器学习问题。标注数据表示输入输出对应关系预测模型对给定的输入产生相应的输出。监督学习的本质是学习输入到输出的映射的统计规律。 通俗来说就是给定数据预测标签。每一个训练数据(training data)都是有特征和标签的。那么什么是特征和标签呢 非常简单我举一个例子。比如银行的贷款部门每一个客户的基本情况都属于特征包括他们的性别、年龄、工作单位类型、工资、目前在名下的房子价值、有无不良贷款记录等等。那么什么是标签就是评估完这些特征之后银行最终的决定是否放贷给客户。ID姓名性别年龄工资工作单位有无不良记录是否贷款1高高男3015国企无是2周周女2313个体无是3乐乐男2715个体无否4新新男3530个体有否 ........... 好的这是我们的训练数据也就是training data那么问题来了如果再来一个人他同样可以提供特征数据那么能预测是否贷款吗这就是监督学习。ID姓名性别年龄工资工作单位有无不良记录是否贷款9方方男2530国企有 一句话概括监督学习给定数据(特征)预测标签。 常见的监督学习算法K近邻(KNN)决策树(DT)朴素贝叶斯(NB)逻辑回归(LR)支持向量机(SVM)等等2无监督学习 无监督学习(unsupervised learning)是指从无标注数据中学习预测模型的机器学习问题。无标注是自然得到的数据预测模型表示数据的类别、转换或概率。无监督学习的本质是学习数据中的统计规律或潜在结构。 无监督学习常常被用于数据挖掘用于在大量无标签数据中发现些什么。它的训练数据是无标签的训练目标是能对观察值进行分类或者区分等。例如无监督学习应该能在不给任何额外提示的情况下仅依据所有“猫”的图片的特征将“猫”的图片从大量的各种各样的图片中将区分出来。 可以想象恰当地提取特征是无监督最为关键的环节。在老虎的识别中我们来尝试提取老虎的特征皮毛、四肢、耳朵、眼睛、胡须、牙齿、舌头等等。通过对特征相同的动物的聚类可以将猫或者猫科动物聚成一类。但是此时我们不知道这群毛茸茸的东西是什么我们只知道这团东西属于一类兔子不在这个类(耳朵不符合)飞机也不在这个类(有翅膀)。特征有效性直接决定着算法有效性。如果我们拿体重来聚类而忽略体态特征恐怕就很难区分出老虎和豹子了。 再比如孩子在一开始认识事物的时候父母会给他一些苹果和橘子但是并不告诉他哪儿个是苹果哪儿个是橘子而是让他自己根据两个事物的特征自己进行判断会把苹果和橘子分到两个不同组中下次再给孩子一个苹果他会把苹果分到苹果组中而不是分到橘子组中。 一句话概括给定数据寻找隐藏的结构。 常见的无监督学习算法K-means聚类主成分分析PCA等等3半监督学习 半监督学习(semi-supervised learning)是指利用标注数据和未标注数据学习预测模型的机器学习问题。通常有少量标注数据、大量未标注数据因为标注数据的构建往往需要人工成本较高未标注数据的手机不需要太多成本。半监督学习旨在利用未标注数据中的信息辅助标注数据进行监督学习以较低的成本达到较好的学习效果。 使用的数据一部分是标记过的而大部分是没有标记的。和监督学习相比较半监督学习的成本较低但是又能达到较高的准确度。综合利用有类标的和没有类标的数据来生成合适的分类函数。4强化学习 强化学习(reinforcement learning)是指智能系统在于环境的连续互动中学习最有行为策略的机器学习问题。假设智能系统与环境的互动基于马尔可夫决策过程智能系统能观测到的是与环境互动得到的数据序列。强化学习的本质是学习最优的序贯决策。 比如说训练一只小狗做动作在它最对动作的情况下奖励骨头再比如AI解游戏问题等等都属于强化学习是可以通过一些方法知道你是离正确答案越来越近还是越来越远(奖惩函数)。可以把奖惩函数看作正确答案的一个延迟、稀疏的形式。可以得到一个延迟的反馈并且只有提示你是离答案越来越近还是越来越远。(注明本文提到的定义均直接采用李航老师的《统计学习方法》) 是不是觉得机器学习也没有想象中那么神秘我后期争取一周更一篇机器学习的推文一起进步呦记得关注喵 留言板