Sayed HossainさんのYouTube動画から。
データはこちらからダウンロードできる。 https://bityl.co/E3kh
以下の手法でパネルデータを作成する。
- プールドOLS回帰モデル
- 固定効果モデルまたはLSDVモデル
- ランダム効果モデル
データ
ここでは、111, 222, 333, 444, 555, 666の6つのコンピュータ会社を取り上げ、コンピュータの販売台数、コンピュータの価格、コンピュータの修理の3つの変数を持っている。ここでは、売上高と他の2つの説明変数(価格、修理費)の関係を調べる。 データは、2000年から2010年まで。したがって、我々の観測値は66となる。
3つのモデル
pooled regression プールド回帰 ここでは、66の観測値をすべてプールし、データの横断的、時系列的な性質を無視して回帰モデルを実行する。 このモデルの大きな問題点は、様々なコンピュータ会社を区別していないことです。言い換えれば、プールによって6つの会社を組み合わせることで、6つのコンピュータ会社の間に存在するかもしれない異質性や個性を否定していることになる。
固定効果モデルまたは LSDV モデル 固定効果モデルまたはLSDVモデルLeast Square Dummy Variable (Regress with group dummies) は、独自の切片値を持たせることによって、6つのコンピュータ会社間の異質性または個別性を許容するものである。 固定効果という言葉は、切片はコンピュータ会社間で異なるかもしれないが、切片は時間的に変化しない、つまり時間不変であるという事実に起因するものである。
ランダム効果モデル ここでは、6社は切片の平均値が共通である。 ここで、どのモデル(固定効果またはランダム効果)を受け入れるのが適切かを確認するために、Hausman 検定を適用することにする。
ハウスマン検定 Hausman Test
帰無仮説: ランダム効果モデルが適切 対立仮説: 固定効果モデルが適切である 統計的に有意なP値が得られたら固定効果モデル、そうでなければランダム効果モデルを使う。
診断チェック
最後に、残差に系列相関があるかどうかを確認することにする。ここでは、Pasaran CD (cross-sectional dependence)検定を用いて、残差に主体間の相関があるかどうかを検定することにする。 Null:系列相関がない。 Alt: 系列相関がある。
データのインポート
. import excel "Panel_Data._Model_One._STATA.xlsx", sheet("Sheet1") firstrow
pooled regression
売り上げ Sales を従属変数、 価格 Price と修理 Repairs を独立変数にする。
. regress Sales Price Repairs Source | SS df MS Number of obs = 66 -------------+---------------------------------- F(2, 63) = 4.10 Model | 3.6436e+11 2 1.8218e+11 Prob > F = 0.0212 Residual | 2.7986e+12 63 4.4422e+10 R-squared = 0.1152 -------------+---------------------------------- Adj R-squared = 0.0871 Total | 3.1630e+12 65 4.8661e+10 Root MSE = 2.1e+05 ------------------------------------------------------------------------------ Sales | Coefficient Std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- Price | 1050.312 391.932 2.68 0.009 267.0987 1833.526 Repairs | 8.831223 7.370528 1.20 0.235 -5.897602 23.56005 _cons | -212624.6 163259.5 -1.30 0.198 -538872.7 113623.5 ------------------------------------------------------------------------------
6社に違いはないという仮定に基づくモデル。 価格 Price のみが有意な変数という結果である。
パネル変数と時間変数を設定する。
パネルは会社、時間は年で設定する。
. xtset CompanyCode YEAR Panel variable: CompanyCode (strongly balanced) Time variable: YEAR, 2000 to 2010 Delta: 1 unit
固定効果モデル
xtreg
コマンドにFixed Mdelの頭文字fe
をつける。
. xtreg Sales Price Repairs, fe Fixed-effects (within) regression Number of obs = 66 Group variable: CompanyCode Number of groups = 6 R-squared: Obs per group: Within = 0.2075 min = 11 Between = 0.0863 avg = 11.0 Overall = 0.0847 max = 11 F(2,58) = 7.59 corr(u_i, Xb) = 0.1577 Prob > F = 0.0012 ------------------------------------------------------------------------------ Sales | Coefficient Std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- Price | 285.1704 73.27324 3.89 0.000 138.498 431.8427 Repairs | -.9394111 5.34654 -0.18 0.861 -11.64167 9.762851 _cons | 95663.84 34678.16 2.76 0.008 26247.97 165079.7 -------------+---------------------------------------------------------------- sigma_u | 231289.36 sigma_e | 21203.939 rho | .99166536 (fraction of variance due to u_i) ------------------------------------------------------------------------------ F test that all u_i=0: F(5, 58) = 1233.32 Prob > F = 0.0000
Prob > F = 0.0012と5%未満であることからモデルのフィットは悪くないことがわかる。
モデルの保存
のちのち比較するためモデルを保存しておく必要がある。Fixed
という名前で保存することにする。
estimates store Fixed
ランダム効果モデル
Randam Effect GLSでの推定値。
. xtreg Sales Price Repairs, re Random-effects GLS regression Number of obs = 66 Group variable: CompanyCode Number of groups = 6 R-squared: Obs per group: Within = 0.2075 min = 11 Between = 0.0860 avg = 11.0 Overall = 0.0844 max = 11 Wald chi2(2) = 15.83 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0004 ------------------------------------------------------------------------------ Sales | Coefficient Std. err. z P>|z| [95% conf. interval] -------------+---------------------------------------------------------------- Price | 286.5764 72.07584 3.98 0.000 145.3103 427.8424 Repairs | -.9714552 5.13579 -0.19 0.850 -11.03742 9.094508 _cons | 95345.83 119938.4 0.79 0.427 -139729.1 330420.8 -------------+---------------------------------------------------------------- sigma_u | 285744.06 sigma_e | 21203.939 rho | .99452362 (fraction of variance due to u_i) ------------------------------------------------------------------------------
Prob > F = 0.0004と5%未満であることからモデルのフィットは悪くないことがわかる。
モデルの保存
estimates store Random
ハウスマン検定
固定効果モデルで推定したFixed
をハウスマン検定にかける。
. hausman Fixed ---- Coefficients ---- | (b) (B) (b-B) sqrt(diag(V_b-V_B)) | Fixed Random Difference Std. err. -------------+---------------------------------------------------------------- Price | 285.1704 286.5764 -1.405973 13.1925 Repairs | -.9394111 -.9714552 .0320441 1.48632 ------------------------------------------------------------------------------ b = Consistent under H0 and Ha; obtained from xtreg. B = Inconsistent under Ha, efficient under H0; obtained from xtreg. Test of H0: Difference in coefficients not systematic chi2(2) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 0.01 Prob > chi2 = 0.9942
カイ二乗検定の結果は Prob > chi2 = 0.9942 であり、5%有意ではない。 帰無仮説は棄却しないため、ランダム効果モデルが適切ということなる。
残差の系列相関のチェック
パッケージst0113
のインストールが必要のようだ。
net install st0113.pkg
Pasaran CD (cross-sectional dependence)検定を行う。
. xtcsd, pesaran abs Pesaran's test of cross sectional independence = 0.956, Pr = 0.3391 Average absolute value of the off-diagonal elements = 0.553
有意確率はPr = 0.3391であり、5%有意ではない。帰無仮説は「系列相関がない」であるため、系列相関を考えなくてもよいことがわかった。