井出草平の研究ノート

パネルデータ分析における固定効果およびランダム効果[Stata]

Sayed HossainさんのYouTube動画から。

www.youtube.com

データはこちらからダウンロードできる。 https://bityl.co/E3kh


以下の手法でパネルデータを作成する。

  1. プールドOLS回帰モデル
  2. 固定効果モデルまたはLSDVモデル
  3. ランダム効果モデル

データ

ここでは、111, 222, 333, 444, 555, 666の6つのコンピュータ会社を取り上げ、コンピュータの販売台数、コンピュータの価格、コンピュータの修理の3つの変数を持っている。ここでは、売上高と他の2つの説明変数(価格、修理費)の関係を調べる。 データは、2000年から2010年まで。したがって、我々の観測値は66となる。

3つのモデル

  1. pooled regression プールド回帰 ここでは、66の観測値をすべてプールし、データの横断的、時系列的な性質を無視して回帰モデルを実行する。 このモデルの大きな問題点は、様々なコンピュータ会社を区別していないことです。言い換えれば、プールによって6つの会社を組み合わせることで、6つのコンピュータ会社の間に存在するかもしれない異質性や個性を否定していることになる。

  2. 固定効果モデルまたは LSDV モデル 固定効果モデルまたはLSDVモデルLeast Square Dummy Variable (Regress with group dummies) は、独自の切片値を持たせることによって、6つのコンピュータ会社間の異質性または個別性を許容するものである。 固定効果という言葉は、切片はコンピュータ会社間で異なるかもしれないが、切片は時間的に変化しない、つまり時間不変であるという事実に起因するものである。

  3. ランダム効果モデル ここでは、6社は切片の平均値が共通である。 ここで、どのモデル(固定効果またはランダム効果)を受け入れるのが適切かを確認するために、Hausman 検定を適用することにする。

ハウスマン検定 Hausman Test

帰無仮説: ランダム効果モデルが適切 対立仮説: 固定効果モデルが適切である 統計的に有意なP値が得られたら固定効果モデル、そうでなければランダム効果モデルを使う。

診断チェック

最後に、残差に系列相関があるかどうかを確認することにする。ここでは、Pasaran CD (cross-sectional dependence)検定を用いて、残差に主体間の相関があるかどうかを検定することにする。 Null:系列相関がない。 Alt: 系列相関がある。

データのインポート

. import excel "Panel_Data._Model_One._STATA.xlsx", sheet("Sheet1") firstrow

pooled regression

売り上げ Sales を従属変数、 価格 Price と修理 Repairs を独立変数にする。

. regress Sales Price Repairs

      Source |       SS           df       MS      Number of obs   =        66
-------------+----------------------------------   F(2, 63)        =      4.10
       Model |  3.6436e+11         2  1.8218e+11   Prob > F        =    0.0212
    Residual |  2.7986e+12        63  4.4422e+10   R-squared       =    0.1152
-------------+----------------------------------   Adj R-squared   =    0.0871
       Total |  3.1630e+12        65  4.8661e+10   Root MSE        =    2.1e+05

------------------------------------------------------------------------------
       Sales | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
       Price |   1050.312    391.932     2.68   0.009     267.0987    1833.526
     Repairs |   8.831223   7.370528     1.20   0.235    -5.897602    23.56005
       _cons |  -212624.6   163259.5    -1.30   0.198    -538872.7    113623.5
------------------------------------------------------------------------------

6社に違いはないという仮定に基づくモデル。 価格 Price のみが有意な変数という結果である。

パネル変数と時間変数を設定する。

パネルは会社、時間は年で設定する。

. xtset CompanyCode YEAR

Panel variable: CompanyCode (strongly balanced)
 Time variable: YEAR, 2000 to 2010
         Delta: 1 unit

固定効果モデル

xtregコマンドにFixed Mdelの頭文字feをつける。

. xtreg Sales Price Repairs, fe

Fixed-effects (within) regression               Number of obs     =         66
Group variable: CompanyCode                     Number of groups  =          6

R-squared:                                      Obs per group:
     Within  = 0.2075                                         min =         11
     Between = 0.0863                                         avg =       11.0
     Overall = 0.0847                                         max =         11

                                                F(2,58)           =       7.59
corr(u_i, Xb) = 0.1577                          Prob > F          =     0.0012

------------------------------------------------------------------------------
       Sales | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
       Price |   285.1704   73.27324     3.89   0.000      138.498    431.8427
     Repairs |  -.9394111    5.34654    -0.18   0.861    -11.64167    9.762851
       _cons |   95663.84   34678.16     2.76   0.008     26247.97    165079.7
-------------+----------------------------------------------------------------
     sigma_u |  231289.36
     sigma_e |  21203.939
         rho |  .99166536   (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(5, 58) = 1233.32                    Prob > F = 0.0000

Prob > F = 0.0012と5%未満であることからモデルのフィットは悪くないことがわかる。

モデルの保存

のちのち比較するためモデルを保存しておく必要がある。Fixedという名前で保存することにする。

estimates store Fixed

ランダム効果モデル

Randam Effect GLSでの推定値。

. xtreg Sales Price Repairs, re

Random-effects GLS regression                   Number of obs     =         66
Group variable: CompanyCode                     Number of groups  =          6

R-squared:                                      Obs per group:
     Within  = 0.2075                                         min =         11
     Between = 0.0860                                         avg =       11.0
     Overall = 0.0844                                         max =         11

                                                Wald chi2(2)      =      15.83
corr(u_i, X) = 0 (assumed)                      Prob > chi2       =     0.0004

------------------------------------------------------------------------------
       Sales | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
       Price |   286.5764   72.07584     3.98   0.000     145.3103    427.8424
     Repairs |  -.9714552    5.13579    -0.19   0.850    -11.03742    9.094508
       _cons |   95345.83   119938.4     0.79   0.427    -139729.1    330420.8
-------------+----------------------------------------------------------------
     sigma_u |  285744.06
     sigma_e |  21203.939
         rho |  .99452362   (fraction of variance due to u_i)
------------------------------------------------------------------------------

Prob > F = 0.0004と5%未満であることからモデルのフィットは悪くないことがわかる。

モデルの保存

estimates store Random

ハウスマン検定

固定効果モデルで推定したFixedをハウスマン検定にかける。

. hausman Fixed

                 ---- Coefficients ----
             |      (b)          (B)            (b-B)     sqrt(diag(V_b-V_B))
             |     Fixed        Random       Difference       Std. err.
-------------+----------------------------------------------------------------
       Price |    285.1704     286.5764       -1.405973         13.1925
     Repairs |   -.9394111    -.9714552        .0320441         1.48632
------------------------------------------------------------------------------
                          b = Consistent under H0 and Ha; obtained from xtreg.
           B = Inconsistent under Ha, efficient under H0; obtained from xtreg.

Test of H0: Difference in coefficients not systematic

    chi2(2) = (b-B)'[(V_b-V_B)^(-1)](b-B)
            =   0.01
Prob > chi2 = 0.9942

カイ二乗検定の結果は Prob > chi2 = 0.9942 であり、5%有意ではない。 帰無仮説は棄却しないため、ランダム効果モデルが適切ということなる。

残差の系列相関のチェック

パッケージst0113のインストールが必要のようだ。

net install st0113.pkg

Pasaran CD (cross-sectional dependence)検定を行う。

. xtcsd, pesaran abs
 
Pesaran's test of cross sectional independence =     0.956, Pr = 0.3391
 
Average absolute value of the off-diagonal elements =     0.553

有意確率はPr = 0.3391であり、5%有意ではない。帰無仮説は「系列相関がない」であるため、系列相関を考えなくてもよいことがわかった。