爱站网长尾关键词搜索,开发公司消防未移交物业,成都新站软件快速排名,旅游网网站建设方案隐变量又称潜变量#xff0c;顾名思义就是隐藏着的随机变量#xff0c;它不能通过观测来得到#xff0c;或者说它产生的过程是不可观测的#xff0c;然而它却可以在潜移默化中影响可观测变量。
我们用抛硬币为例来解释什么是隐变量。假设有 A 、 B 、 C A、B、C A、B、C …隐变量又称潜变量顾名思义就是隐藏着的随机变量它不能通过观测来得到或者说它产生的过程是不可观测的然而它却可以在潜移默化中影响可观测变量。
我们用抛硬币为例来解释什么是隐变量。假设有 A 、 B 、 C A、B、C A、B、C 三枚硬币正面向上的概率分别为 θ A θ_A θA 、 θ B θ_B θB、 θ C θ_C θC 我们想求出 θ B θ_B θB 和 θ C θ_C θC 目前尚不知晓但可以通过抛硬币的观测结果推测出来。
抛这三枚硬币的游戏规则是第一步先抛硬币 A A A 第二步如果硬币 A A A 正面向上则选择硬币 B B B 抛10次记录这10次的结果如果硬币 A A A 反面向上则选择硬币 C C C 抛10次记录这10次的结果。这样重复5次则可以得到50个抛硬币的观测数据
硬币A的结果(已知)硬币B的结果(观测数据)硬币C的结果(观测数据)反正反反反正正反正反正正正正正正反正正正正正正正反正正正正正反正正反正反正反反反正正反反正反正正正反正正正反正
我们可以利用这个观测结果来估计 θ B θ_B θB 和 θ C θ_C θC。
硬币 B B B 在30次中正面向上出现24次反面向上出现6次由极大似然可得出现这种结果的概率为 θ B 24 ( 1 − θ B ) 6 θ_B^{24}(1-θ_B)^{6} θB24(1−θB)6对应的图像如下 可以看到在 θ B 0.8 θ_B0.8 θB0.8 时取到最大值即 θ B 24 30 0.8 θ_B{24\over 30}0.8 θB30240.8 。
同理可得 θ C 9 20 0.45 θ_C{9\over 20}0.45 θC2090.45 至此我们通过观测数据估计出了硬币 B 、 C B、C B、C 正面向上的概率然而我们需要知道得到这组观测数据的前提是每次我们知道该抛的是硬币 B B B 还是硬币 C C C 。
如果我们在上面的抛硬币游戏中将第一步放入暗箱里操作也就是说抛硬币 A A A 的结果我们不得而知只能得到最终50个观测结果
硬币A的结果(未知)硬币B或C的结果(观测数据)不知道正反反反正正反正反正不知道正正正正反正正正正正不知道正反正正正正正反正正不知道正反正反反反正正反反不知道反正正正反正正正反正
那么在这种情况下如何去估计出 θ B θ_B θB 和 θ C θ_C θC 呢此时就不能用最大似然去估计了因为我们不再知道每组结果是来自硬币 B B B 还是 C C C 。
这里未知的硬币 A A A 的结果其实就是个隐变量。
关于这种情况下 θ B θ_B θB 和 θ C θ_C θC 的求法我会在后面的 EM 算法里讲。