太原搭建网站的公司哪家好,怎么做微信网页制作,品牌网站建设维护,消息网站怎么做转载自   NLP Coursera By Michael Collins - Week1 
NLP Coursera By Michael Collins - Week1 
构建模型框架 - Markov Process 
毕竟是机器学习嘛#xff0c;所以第一步#xff0c;先要把实际问题转化成数学模型。 在NLP中#xff0c;一般使用的都是概率模型#xff0c;…转载自   NLP Coursera By Michael Collins - Week1 
NLP Coursera By Michael Collins - Week1 
构建模型框架 - Markov Process 
毕竟是机器学习嘛所以第一步先要把实际问题转化成数学模型。 在NLP中一般使用的都是概率模型即把语言模型变成概率论范畴。 
比如说现在有一段语音说的很含糊没有听清楚好像是“like your”又好像是“lie cured”。 
那么到底是哪一种呢我们就看在现有的语料库中到底是“like your”出现的概率大还是“lie cured”的概率大。 
于是就把语音识别问题转变成了一个概率问题输入一串字符输出这串字符组合在一起的概率如果概率大就是正确的句子。 
下面构建这个模型 至此模型框架搭建完毕但是参数还没有设定好。 
也就是说现在如果向模型中随便输入一个句子要求输出的结果是这个句子出现的概率。 
那么我们就需要事先知道模型中每一个p(w|u,v)。 
用如下方式来计算 对于上面的计算方法不能解决出现概率为0但实际这句句子是合理的情况。 
下面介绍两种方法来对上面的计算方法进行改进 
第一种是Linear Interpolation 这里的三个系数用下面的方法进行选择 其实这个方法就是将三种计算概率的方式线性结合起来具体的结合方式有很多种上面只是其中一种。 
上面这个方法中的三个系数和概率本身没有关系但是更好的方法是让他们有关系 
bucketing法对不同范围内的counts使用不同的系数 将三个系数都写成同一个参数的线性组合 第二种是Discounting Method: 
这个方式就是从概率不为0的情况中分出一部分的概率给概率为0的情况。 至此为止整个模型搭建完毕。 评价模型 
一般情况下 当服从均匀分布的时候 以上就是这一周的课程中讲的内容。notes中的内容和这个一样基本没有什么补充。 
下面用一张流程图来总结一下整个模型的构建过程。