万网主机网站建设数据库怎么弄,网站建设怎么添加视频,中国中小企业官网,软件外包业务目录
朴素贝叶斯基于样本特征来预测样本属于的类别y
朴素贝叶斯算法的基本概念与核心思想 假设两个特征维度之间是相互独立的
拉普拉斯平滑增加出现次数保证0不出现
编辑 基于样本特征来预测样本属于的类别y
什么是拉普拉斯平滑 朴素贝叶斯基于样本特征来预测样本属于的…目录
朴素贝叶斯基于样本特征来预测样本属于的类别y
朴素贝叶斯算法的基本概念与核心思想 假设两个特征维度之间是相互独立的
拉普拉斯平滑增加出现次数保证0不出现
编辑 基于样本特征来预测样本属于的类别y
什么是拉普拉斯平滑 朴素贝叶斯基于样本特征来预测样本属于的类别y 朴素贝叶斯算法的基本概念与核心思想
首先我们来讨论一下朴素贝叶斯算法里面涉及到的几个核心概念先验概率、后验概率、联合概率、全概率公式、贝叶斯公式。 想象这样一个场景在一个炎热夏天的午后我们想整个又大又甜的西瓜来清爽一下。于是我们一路小跑的来到超市到超市以后我们需要选一个又大又甜的西瓜。我们根据常识或是经验知道放在超市里面卖的西瓜一般情况下是熟的假设根据统计在超市里面卖的西瓜成熟的概率是70%这个概率就是先验概率先验概率prior probability就是根据以往经验和分析得到的概率。
因为是西瓜成熟的概率是 70%所以还有 30% 的西瓜没有熟所以我们还是需要好好挑一挑。那我们根据什么选择呢?作为一个吃货我有些经验比如瓜蒂脱落的话西瓜成熟的概率会更高大概是 85%。如果把瓜蒂脱落当作一种已有的结果然后去推测西瓜成熟的概率
这个概率 P(瓜熟 | 瓜蒂脱落) 就被称为后验概率。后验概率类似于条件概率。 假设两个特征维度之间是相互独立的
辛苦/情书0导致误差 拉普拉斯平滑增加出现次数保证0不出现 基于样本特征来预测样本属于的类别y 什么是拉普拉斯平滑
拉普拉斯平滑是朴素贝叶斯分类器中一种常用的平滑方法它通过为每个特征的计算增加一个正数值来避免出现概率为0的情况从而提高了分类器的准确性和可靠性。
一般情况下在朴素贝叶斯分类器中计算某个特征的条件概率值时都会遇到特征值在训练集中未出现的情况此时如果直接根据频数统计则估计值将为0这一现象我们称之为“零概率问题”。拉普拉斯平滑的本质就在于对这种情况的处理。