格蘭傑因果關係

格蘭傑因果關係檢驗（英語：）是一種假設檢定的統計方法，檢驗一組時間序列 $x$ 是否為另一組時間序列 $y$ 的原因。它的基礎是迴歸分析當中的自迴歸模型。迴歸分析通常只能得出不同變量間的同期相關性；自迴歸模型只能得出同一變量前後期 的相關性；但諾貝爾經濟學獎得主克萊夫·格蘭傑（Clive Granger）於1969年論證[1] ，在自迴歸模型中透過一系列的檢定進而揭示不同變量之間的時間落差相關性是可行的。

格蘭傑本人在其2003年獲獎演說中強調了其引用的局限性，以及“很多荒謬論文的出現”（Of course, many ridiculous papers appeared）。格蘭傑因果關係檢驗的結論只是一種統計估計，不是真正意義上的因果關係，不能作爲肯定或否定因果關係的根據。同時，格蘭傑因果關係檢驗也有一些不足之處，如並未考慮干擾因素的影響，也未考慮時間序列間非線性的相互關係。一些基於格蘭傑因果關係檢驗的方法一定程度上解決了這些問題[2]。

核心概念

過去值（lag value，或稱滯後值）：同一變項比當期時間上更早的值。例如：當期為 $y_{10}$ ，它的滯後值為 $y_{i<10}$ 。

格蘭傑因果關係檢驗的基本觀念在於：未來的事件不會對目前與過去產生因果影響，而過去的事件才可能對現在及未來產生影響。[1][3] 也就是說，如果我們試圖探討變數 $x$ 是否對變數 $y$ 有因果影響，那麼只需要估計 $x$ 的滯後值是否會影響 $y$ 的現在值，因為 $x$ 的未來值不可能影響 $y$ 的現在值。假如在控制了 $y$ 變數的過去值以後， $x$ 變數的過去值仍能對Y 變數有顯著的解釋能力，我們就可以稱 $x$ 能「Granger 影響」（Granger-cause） $y$ 。[4]

侷限性和改進

最初版的格蘭傑因果測試，有時候無法發現真正的因果關係。因為雖然對於認定因果關係而言，理論上還必須控制其他可能的干擾因素，但在 Granger 最初提出這套因果測試的版本中，並未納入干擾變數的分析，而是假設其他可能解釋變數的資訊包含在 $y$ 的落後值中。如果事實上帶來因果關係的是第三變數（干擾變數），亦即若事實上操控 $x$ 並無法改變 $y$ ，格蘭傑因果關係的零假設仍然可能被拒絕。因此標準版的格蘭傑因果測試結果可能會產生誤導性。

1980年代由其他的計量經濟學家對Granger測試加以修改、擴充，將可能的第三（以上）變數納入測試，成為使用追蹤資料的向量自迴歸模型（英語：）。相較於最初版的 Granger 測試，擴充版可以產生更有效的估計結果。[4]

步驟描述

準備工作：一開始要用幾個落後期來建立模型，需要研究者的評估，通常使用赤池信息量準則（英語：）或貝氏訊息量準則（英語：）來判斷。
格蘭傑因果關係檢驗的第一步是建立用 $y$ 的滯後值來預測 $y$ 的自迴歸模型。此際，如果時間序列 $y$ 是廣義平穩的，則可以直接使用滯後值。如果不平穩，就必須對不平穩的時間序列先做（一階或更多階）差分，直到得出平穩時間數列。
如果發現 $y$ 的某期滯後值 (1) 在迴歸分析中具有顯著性（根據 t檢定的p值來判斷），且 (2) 這期滯後值加入模型後可提高迴歸模型的解釋力（根據迴歸分析的F檢定），這個滯後值便被留在模型中。
然後進一步加入 $x$ （或Δ $x$ ）的滯後期來擴充迴歸模型。關於平穩時間序列的要求、某期滯後值留在模型中的條件，同上述 $y$ 的處理。
若且唯若（充分必要）沒有任何解釋變項 $x$ （或Δ $x$ ）的滯後值被留在模型中，便無法拒絕無格蘭傑因果關係的零假設。

研究人員希望發現明顯的證據，比如 $x$ 是 $y$ 的格蘭傑原因但反之不成立，便能做出因果關係的推論。然而在實際操作中也可能會發現沒有變量是對方的格蘭傑原因，或者 $x$ 和 $y$ 兩個變量互為格蘭傑原因。

數學定義

1. 令 $x$ 和 $y$ 為廣義平穩序列。如要檢測 $x$ 非 $y$ 的格蘭傑原因之零假設，首先引入 $y$ 的滯後值建立 $y$ 的自迴歸模型（AR model on $y$ ）：

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+...+a_{m}y_{t-m}+residual_{t}.

所有的

y

滯後值中：(1) 在迴歸分析中具有顯著性（根據t-統計值的p值來判斷）的，且 (2) 這期滯後值加入模型後可提高迴歸模型的解釋力（根據迴歸分析的F檢定）的－－將被留在模型中。

m

表示的是

y

變量滯後期中檢定為顯著的時間上最早一個。

2. 接著，引入 $x$ 的滯後值建立增廣迴歸模型：

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+...a_{m}y_{t-m}+b_{p}x_{t-p}+...+b_{q}x_{t-q}+residual_{t}.

所有的

x

滯後值中：(1) 在迴歸分析中具有顯著性（根據t檢驗的p值來判斷）的，且 (2) 這期滯後值加入模型後可提高迴歸模型的解釋力（根據迴歸分析的F檢定）的－－將被留在模型中。在以上增廣迴歸模型中，

p

代表

x

變量滯後值中檢定為顯著的時間上最早一個，

q

則是

x

變量滯後值中檢定為顯著的時間上最近一個。

3. 如果沒有任何 $x$ 的滯後值被留在模型中，無格蘭傑因果關係的零假設就成立。

軟件運行

一些統計軟體可以執行Granger causality test。例如：Stata、SPSS[5]、EViews[6]、R語言。

這裡舉個R語言中lmtest程序庫裡grangertest()指令的例子：

Granger causality test

Model 1: fii ~ Lags(fii, 1:5) + Lags(rM, 1:5)
Model 2: fii ~ Lags(fii, 1:5)
  Res.Df  Df      F  Pr(>F)
1    629
2    634   5 2.5115 0.02896 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Granger causality test

Model 1: rM ~ Lags(rM, 1:5) + Lags(fii, 1:5)
Model 2: rM ~ Lags(rM, 1:5)
  Res.Df  Df      F Pr(>F)
1    629
2    634   5 1.1804 0.3172

模型1檢驗將滯後的rM從解釋FII的回歸模型中移除是否可行，答案是不可行的（因為p值 = 0.02896）。但由模型1和模型2的組合可發現從解釋rM的模型中移除FII的滯後值是可能的。我們可以由此斷定rM是FII的格蘭傑原因，反之則不成立。

延伸

承繼著回歸模型的基本性質，格蘭傑因果關係分析也假設實際值與預測值之間的誤差呈常態分佈，若實際現象不呈常態分佈將嚴重影響推論的有效性。

Hacker & Hatemi-J (2006)發展出一種不必在乎誤差項是否呈正態分佈的格蘭傑因果關係研究方法[7]。這種方法在財金分析上特别實用，因為許多金融變量不服從常態分佈。[8]

近來，Hacker & Hatemi-J (2012)又進一步改善之，提出一種非對稱的因果關係檢驗模型，據說可以區分正向與負向影響的因果影響。[9]

註腳

Granger, Clive W. J. . Econometrica (The Econometric Society). 1969, 37 (3): 424–438 [2015-04-20]. （原始内容存档于2016-03-06）.
Bahadori, Mohammad Tahalast; Liu, Yan. (PDF). University of Southern California. 2014 [2015-04-20]. （原始内容存档 (PDF)于2015-04-27）.
Anil Seth. . Scholarpedia. 2007, 2 (7): 1667 [2011-03-07]. doi:10.4249/scholarpedia.1667. （原始内容存档于2011-08-10）.
劉孟奇，張其祿，盧敬植. (PDF). 公共行政學報. 2010: 1–27 [2015-04-20]. （原始内容存档 (PDF)于2016-03-04）.
. Google Answers. [2013-03-08]. （原始内容存档于2013-05-27）.
. YouTube. [2013-03-08]. （原始内容存档于2016-09-24）.
Hacker R.S. and Hatemi-J A. (2006) "Tests for causality between integrated variables using asymptotic and bootstrap distributions: theory and application" 页面存档备份，存于, Applied Economics, Vol. 38(13), pp. 1489–1500.
Mandelbrot, Benoit. . Journal of Business. 1963, 36 (1): 394–419. doi:10.1086/294632.
Hatemi-J, A. . Empirical Economics. 2012, 42 (6): forthcoming. doi:10.1007/s00181-011-0484-x.