方差
方差(英語:),應用數學裡的專有名詞。在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二階主動差,恰巧也是它的二阶累积量。這裡把複雜說白了,就是將各個誤差之平方(而非取絕對值,使之肯定為正數),相加之後再除以總數,透過這樣的方式來算出各個數據分佈、零散(相對中心點)的程度。繼續延伸的話,方差的正平方根称为该随机变量的标准差(此為相對各個數據點間),方差除以期望值归一化的值叫分散指数,标准差除以期望值归一化的值叫变异系数。
「Variance」的各地常用別名 | |
---|---|
中国大陸 | |
臺灣 | |
港澳 | |
日本、韓國漢字 | 分散 |
定义
设X为服从分布F的随机变量,
如果E[X]是随机变量X的期望值(平均數μ=E[X])
随机变量X或者分布F的方差为:
这个定义涵盖了连续、离散、或两者都有的随机变量。方差亦可當作是随机变量与自己本身的共变异数:
方差典型的标记有Var(X), , 或是,其表示式可展开成为:
上述的表示式可记为"平方的期望減掉期望的平方"。
离散随机变量
如果随机变量X是具有概率质量函數的离散随机分布x1 ↦ p1, ..., xn ↦ pn,則:
此處是其期望值, 即:
- .
當X為有n個相等機率值的平均分佈:
n個相等機率值的方差亦可以點對點間的方變量表示為:
连续型随机变量
如果随机变量X是連續分布,並對應至概率密度函數f(x),則其方差為:
此處是一期望值,
且此處的積分為以X為範圍的x定積分(definite integral)
如果一個連續分佈不存在期望值,如柯西分佈(Cauchy distribution),也就不會有方差(不予定义)。
特性
方差不會是負的,因為次方計算為正的或為零:
一個常數隨機變數的方差為零,且當一個資料集的方差為零時,其內所有項目皆為相同數值:
方差不變於定位參數的變動。也就是說,如果一個常數被加至一個數列中的所有變數值,此數列的方差不會改變:
如果所有數值被放大一個常數倍,方差會放大此常數的平方倍:
兩個隨機變數合的方差為:
此數Cov(., .)代表共變異數。
對於個隨機變數的總和:
在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间: L2(Ω, dP),不过这裡的内积和长度跟协方差,标准差还是不大一样。 所以,我们得把这个空间“除”常变量构成的子空间,也就是说把相差一个常数的 所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间, 并且有一个从旧空间内积诱导出来的新内积,而这个内积就是协方差。
一般化
如果X是一个向量其取值范围在實數空间Rn,并且其每个元素都是一个一维随机变量,我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广,其定义为E[(X − μ)(X − μ)T],其中μ = E(X),XT是X的转置。这个方差是一个非负定的方阵,通常称为协方差矩阵。
如果X是一个複數随机变量的向量(向量中每個元素均為複數的隨機變數),那么其方差定义则为E[(X − μ)(X − μ)*],其中X*是X的共轭转置向量或稱為埃尔米特向量。根据这个定义,變異數为实数。
历史
「方差」(variance)这个名词率先由羅納德·費雪(英語:)在论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》[1]中提出。后来「半方差」(semi variance),「亚方差」(hypo variance),「超方差」(super variance),「圆方差」(circular variance)与「倒方差」(inverse variance)等类似概念也被逐渐延伸出去。