建站系统加盟,网站定制哪家正规,市面上有什么搭建网站工作室,商城图片二值编码独热编码定义 #xff1a;One-Hot Encoding即One-Hot 编码#xff0c;也称独热编码#xff0c;又称一位有效编码#xff0c;其方法是使用N位状态寄存器来对N个状态进行编码#xff0c;每个状态都由他独立的寄存器位#xff0c;并且在任意时候#xff0c;其中只有… 二值编码独热编码定义 One-Hot Encoding即One-Hot 编码也称独热编码又称一位有效编码其方法是使用N位状态寄存器来对N个状态进行编码每个状态都由他独立的寄存器位并且在任意时候其中只有一位有效。 应用场景由于分类器往往默认数据数据是连续的并且是有序的但是在很多机器学习任务中存在很多离散分类特征因而将特征值转化成数字时往往也是不连续的 One-Hot 编码解决了这个问题 示例 实际类别1类别2类别3类别4类别5类别6自然状态码为000,001,010,011,100,101独热编码为000001,000010,000100,001000,010000,100000 可以这样理解对于每一个特征如果它有m个可能值那么经过独热编码后就变成了m个二元特征。并且这些特征互斥每次只有一个激活。因此数据会变成稀疏的。 这样做的好处主要有 解决了分类器不好处理属性数据的问题在一定程度上也起到了扩充特征的作用 独热编码优缺点 优点独热编码解决了分类器不好处理属性数据的问题在一定程度上也起到了扩充特征的作用。它的值只有0和1不同的类型存储在垂直的空间。缺点当类别的数量很多时特征空间会变得非常大。在这种情况下一般可以用PCA来减少维度。而且one hot encodingPCA这种组合在实际中也非常有用。 独热编码的实现