似然函数

在数理统计学中，似然函数是一种关于统计模型中的参数的函数，表示模型参数中的似然性。似然函数在統計推論中有重大作用，如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近，都是指某种事件发生的可能性，但是在统计学中，“似然性”和“概率”（或然性）又有明确的区分：概率，用于在已知一些参数的情況下，预测接下来在观测上所得到的结果；似然性，则是用于在已知某些观测所得到的结果时，对有关事物之性质的参数进行估值。

在这种意义上，似然函数可以理解为条件概率的逆反。在已知某个参数B时，事件A会发生的概率写作：

P(A\mid B)={\frac {P(A,B)}{P(B)}}\!

利用，

P(B\mid A)={\frac {P(A\mid B)\;P(B)}{P(A)}}\!

因此，我们可以反过来构造表示似然性的方法：已知有事件A发生，运用似然函数 $\mathbb {L} (B\mid A)$ ，我们估计参数B的可能性。形式上，似然函数也是一种条件概率函数，但我们关注的变量改变了：

b\mapsto P(A\mid B=b)\!

注意到这里并不要求似然函数满足归一性： $\sum _{b\in {\mathcal {B}}}P(A\mid B=b)=1$ 。一个似然函数乘以一个正的常数之后仍然是似然函数。对所有 $\alpha >0$ ，都可以有似然函数：

L(b\mid A)=\alpha \;P(A\mid B=b)\!

例子

圖1. 两次投掷都正面朝上时的似然函数

考虑投掷一枚硬币的实验。通常来说，已知掷出一枚“公平的硬币”（正面朝上和反面朝上的概率都为0.5）, 即正面(Head)朝上的概率为 $p_{H}=0.5$ ，便可以知道投掷若干次后出现各种结果的可能性。

比如说，投两次都是正面朝上的概率是0.25。用条件概率表示，就是：

P({\mbox{HH}}\mid p_{H}=0.5)=0.5^{2}=0.25

其中H表示正面朝上。

如果一个硬币的质量分布不够均匀, 那么它可能是一枚"非公平的硬币"

在统计学中，我们关心的是在已知一系列投掷的结果时，关于硬币投掷时正面朝上的可能性的信息。
我们可以建立一个统计模型：假设硬币投出时会有 $p_{H}$ 的概率正面朝上，而有 $1-p_{H}$ 的概率反面朝上。
这时，通过观察已发生的两次投掷，条件概率可以改写成似然函数：

L(p_{H}\mid {\mbox{HH}})=P({\mbox{HH}}\mid p_{H}=0.5)=0.25

也就是说，对于取定的似然函数，在观测到两次投掷都是正面朝上时， $p_{H}=0.5$ 的似然性是0.25。注意，反之并不成立，即当似然函数为0.25时不能推论出 $p_{H}=0.5$ 。

如果考虑 $p_{H}=0.6$ ，那么似然函数的值也会改变。

L(p_{H}\mid {\mbox{HH}})=P({\mbox{HH}}\mid p_{H}=0.6)=0.36

圖2. 三次投掷中头两次正面朝上，第三次反面朝上时的似然函数

如圖1所示，注意到似然函数的值变大了。
这说明，如果参数 $p_{H}$ 的取值变成0.6的话，结果观测到连续两次正面朝上的概率要比假设 $p_{H}=0.5$ 时更大。也就是说，参数 $p_{H}$ 取成0.6要比取成0.5更有说服力，更为“合理”。
总之，似然函数的重要性不是它的具体取值，而是当参数变化时函数到底变小还是变大。

      对同一个似然函数，其所代表的模型中，某项参数值具有多种可能，但如果存在一个参数值，使得它的函数值达到最大的话，那么这个值就是该项参数最为“合理”的参数值。

在这个例子中，如圖1所示，似然函数实际上等于：

L(\theta \mid {\mbox{HH}})=P({\mbox{HH}}\mid p_{H}=\theta )=\theta ^{2}

，其中

0\leq p_{H}\leq 1

。

如果取 $p_{H}=1$ ，那么似然函数达到最大值1。也就是说，当连续观测到两次正面朝上时，假设硬币投掷时正面朝上的概率为1是最合理的。

类似地，如果观测到的是三次投掷硬币，头两次正面朝上，第三次反面朝上，如圖2所示，那么似然函数将会是：

L(\theta \mid {\mbox{HHT}})=P({\mbox{HHT}}\mid p_{H}=\theta )=\theta ^{2}(1-\theta )

，其中T表示反面朝上，

0\leq p_{H}\leq 1

。

这时候，似然函数的最大值将会在 $p_{H}={\frac {2}{3}}$ 的时候取到。也就是说，当观测到三次投掷中前两次正面朝上而后一次反面朝上时，估计硬币投掷时正面朝上的概率 $p_{H}={\frac {2}{3}}$ 是最合理的。

应用

最大似然估计

最大似然估计是似然函数最初也是最自然的应用。上文已经提到，似然函数取得最大值表示相应的参数能够使得统计模型最为合理。从这样一个想法出发，最大似然估计的做法是：首先选取似然函数（一般是概率密度函数或概率质量函数），整理之后求最大值点。实际应用中一般会取似然函数的对数作为求最大值的函数，这样求出的最大值点和直接求最大值点得到的结果是相同的。似然函数的最大值点不一定唯一，也不一定存在。与矩法估计比较，最大似然估计的精确度较高，信息损失较少，但计算量较大。

似然比检验

似然比检验是利用似然函数来检测某个假设（或限制）是否有效的一种检验。一般情况下，要检测某个附加的参数限制是否是正确的，可以将加入附加限制条件的较复杂模型的似然函数最大值与之前的较简单模型的似然函数最大值进行比较。如果参数限制是正确的，那么加入这样一个参数应当不会造成似然函数最大值的大幅变动。一般使用两者的比例来进行比较，這個比值是卡方分配。

尼曼-皮尔森引理说明，似然比检验是所有具有同等显著性差异的检验中最有统计效力的检验。

参考来源

史蒂芬·史蒂格勒. . Journal of the Royal Statistical Society. Series A (General) 141. 1978: 287–322. Stable URL: http://www.jstor.org/stable/2344804页面存档备份，存于
Stephen Stigler. . Harvard University Press. ISBN 0-674-40340-1.
Stephen Stigler. . Harvard University Press. ISBN 0-674-83601-4.
Anders Hald. . Statistical Science 14. 1999年5月: 214–222. Stable URL: http://www.jstor.org/stable/2676741页面存档备份，存于
Hald, A. . New York: Wiley. 1998.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.