一言で言えば、「実験ができない状況下で、擬似的に実験環境を作り出し、真の因果関係(原因と結果)を見抜くための統計手法」である。
世の中のデータの多くは、単に「A(原因)とB(結果)」を見比べるだけでは、誤った結論を導く。なぜなら、そこには「ノイズ(交絡因子)」が混ざっているからだ。
例えば、「広告費(A)」と「売上(B)」の関係を見たいとする。
- 単純な観察:「広告費が多い月は、売上が高い」 「広告は効果がある」
- 裏の事情(ノイズ):「実は、クリスマス時期だから広告を増やし、消費者の購買意欲も勝手に上がっていただけ(景気・季節の影響)」
このように、A(広告)以外の要因(景気など)が邪魔をして、Aが純粋にBにどれだけ効いたのかが分からない。これを「内生性の問題」と呼ばれる。
この「ノイズ」を取り除くために、外部から持ってくる第三の変数のことを「操作変数(Instrumental Variable)」と呼ぶ。
操作変数は、「原因(A)に対して、『外からのショック』として働きかけるもの」として働く。
イメージとしては、ノイズまみれの「原因(A)」の中から、「きれいな成分」だけを抽出するための「フィルター」のようなものである。
どんな変数でも操作変数になれるわけではない。以下の2つの条件をクリアした、選ばれし変数だけが使用可能である。
- 関連性(Relevance):
- その操作変数は、原因(A)を確実に変動させるものであること。
(例:フィルターとして機能するには、液体を通す穴が開いていなければならない)
外生性(Exogeneity):
- その操作変数は、結果(B)やノイズ(C)とは無関係(独立)であること。
- これが最も重要かつ困難な条件である。「運」や「自然現象」のような、人間の意思や社会情勢に左右されない要素が好まれる。
IV法は、論理的に以下の2ステップを行っている(これを数学的に一発で解くのが「2段階最小二乗法」である)
- ステップ1(抽出): 操作変数(外からのショック)を使って、原因(A)の変化のうち、「外部要因によって無理やり動かされた部分(きれいな成分)」だけを取り出す。 (「景気のせいで増えた広告費」は捨てて、「社長の気まぐれ(運)で増えた広告費」だけを残すイメージ)
- ステップ2(推定): その取り出した「きれいな成分」と、結果(B)の関係を見る。 これならばノイズが除去されているため、真の因果関係が判明する。
「ノイズまみれの世界(観察データ)の中に、偶然発生した『自然の実験(ランダムな揺らぎ)』を見つけ出し、それを利用して『もし実験室で実験できたらこうなるはずだ』という真実をあぶり出す方法」
データ
library(ivreg)
data("SchoolingReturns", package = "ivreg")
head(SchoolingReturns)
データ
wage education experience ethnicity smsa south age nearcollege nearcollege2 nearcollege4 enrolled married education66 smsa66 south66 feducation 1 548 7 16 afam yes no 29 no no none no yes 5 yes no 9.94 2 481 12 9 other yes no 27 no no none no yes 11 yes no 8.00 3 721 12 16 other yes no 34 no no none no yes 12 yes no 14.00 4 250 11 10 other yes no 27 yes yes public no yes 11 yes no 11.00 5 729 12 16 other yes no 34 yes yes public no yes 12 yes no 8.00 6 500 12 8 other yes no 26 yes yes public no yes 11 yes no 9.00 meducation fameducation kww iq parents14 library14 1 10.25 9 15 NA both no 2 8.00 8 35 93 both yes 3 12.00 2 42 103 both yes 4 12.00 6 25 88 both yes 5 7.00 8 34 108 both no 6 12.00 6 38 85 both yes
通常の回帰分析 (OLS)
ols_model <- lm(log(wage) ~ education + poly(experience, 2) + ethnicity + smsa + south,
data = SchoolingReturns)
# 結果の表示
summary(ols_model)
結果
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.259820 0.048871 107.626 < 2e-16 ***
education 0.074009 0.003505 21.113 < 2e-16 ***
poly(experience, 2)1 8.931699 0.494804 18.051 < 2e-16 ***
poly(experience, 2)2 -2.642043 0.374739 -7.050 2.21e-12 ***
ethnicityafam -0.189632 0.017627 -10.758 < 2e-16 ***
smsayes 0.161423 0.015573 10.365 < 2e-16 ***
southyes -0.124862 0.015118 -8.259 < 2e-16 ***
通常の回帰分析の結果、教育年数が1年増えるごとに賃金は約7.4%上昇することが示された。すべての項目が統計的に極めて有意であり、結果の信頼性は高い。 また、経験年数は「ある段階で頭打ちになる逆U字型」を描くことや、アフリカ系(約-19%)や南部居住(約-12%)によるマイナス影響、都市部の優位性(約+16%)など、当時の社会構造的な格差も明確に数値化されている。
この7.4%という数値には、個人の「潜在的な能力(地頭の良さ)」の影響が混入している可能性がある。 「もともと優秀だから高学歴で高収入になった」という要因を排除できておらず、教育そのものがもたらす純粋な効果としてはバイアス(偏り)がかかっている可能性が高い点が問題になる。
操作変数法 Instrumental Variable Analysis
| 変数の役割 | 変数名 | 日本語の説明 |
|---|---|---|
| 目的変数 | log(wage) | 賃金の対数 |
| 説明変数 | education | 教育年数(内生変数) |
| 説明変数(共変量) | experience | 経験年数 |
| 説明変数(共変量) | ethnicity | 人種 |
| 説明変数(共変量) | smsa | 都市部居住か |
| 説明変数(共変量) | south | 南部居住か |
| 操作変数 | nearcollege | 育った家の近くに大学があったか(くじ引き役) |
| 操作変数 | age | 経験の代わりの操作変数 |
「教育年数」は個人の能力等の影響を受けるため、通常の分析では偏りが生じる。そこで、本人の能力とは無関係な「大学が家の近くにあったか(nearcollege)」を操作変数(くじ引き役)として利用し、能力によるバイアスを取り除いた因果関係を分析しようとしている。
「地理的な運」を利用した因果推論の仕組み
この分析の最大の目的は、「教育を受けたから給料が上がったのか(因果)」と「もともと優秀な人が教育を受けたから給料が高いだけなのか(相関)」を明確に区別することである。通常の回帰分析(OLS)では、個人の「潜在能力(地頭の良さ)」や「家庭の裕福さ」といったデータには表れない要素が「教育年数」に混入してしまうため、純粋な教育の効果を測ることができない。
そこで、このモデルでは「10代の頃、たまたま家の近くに大学があったかどうか(nearcollege)」という変数を「操作変数(Instrumental Variable)」として導入する。これを「くじ引き」に見立てた分析のロジックは以下の通りです。
1. 「能力」と「住所」の分離
まず前提として、「賢いから大学の近くに住んでいる」わけではない。多くの若者にとって、実家がどこにあるかは自分では選べない「偶然(運)」によって決まる。つまり、「大学が近い人」と「遠い人」の間には、「本人の元々の能力」には差がないと仮定できね。これが、あたかもランダムに割り振られた「くじ引き」と同じ役割を果たす。
2. 地理的な「ひと押し」の効果
次に、この「地理的な運」が行動にどう影響するかを見る。大学が家の近くにあると、通学コストが下がったり、心理的なハードルが下がったりするため、遠い地域の人に比べて「大学に進学する確率」がわずかに高くなると推測される。 ここで重要なのは、「大学が近くにあったから進学した」という人たちの教育年数の増加分は、本人の能力によるものではなく、純粋に「環境(近さ)」によって上乗せされた分だということがわかる。
3. 不純物を取り除いた抽出
このモデル(2段階最小二乗法)は、以下の2つのステップを同時に計算している。
- 第一段階: 全体の教育年数のばらつきの中から、「本人の能力に由来する部分」を無視し、「大学が近くにあったこと(運)によって増えた教育年数の部分」だけを抽出する。
- 第二段階: その抽出された「純粋な教育年数の変動」だけを使って、それが賃金をどれくらい引き上げているかを計算する。
何が行われているのか
通常の分析が「教育年数(能力+教育)」と「賃金」の関係を見ているのに対し、このIV分析は「教育年数(地理的要因のみ)」と「賃金」の関係を見ている。
これにより、「能力が高い人が高給取りなのは当たり前」というバイアス(不純物)をろ過し、「環境要因で背中を押されて教育を受けた人が、その教育によってどれだけ賃金を伸ばしたか」という、教育そのものが持つ純粋な投資効果(因果関係)をあぶり出す。
モデルの作成
iv_model <- ivreg(log(wage) ~ education + poly(experience, 2) + ethnicity + smsa + south |
nearcollege + poly(age, 2) + ethnicity + smsa + south,
data = SchoolingReturns)
summary(iv_model, diagnostics = TRUE)
結果。
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.48522 0.67538 6.641 3.68e-11 ***
education 0.13295 0.05138 2.588 0.009712 **
poly(experience, 2)1 9.14172 0.56350 16.223 < 2e-16 ***
poly(experience, 2)2 -0.93810 1.58024 -0.594 0.552797
ethnicityafam -0.10314 0.07737 -1.333 0.182624
smsayes 0.10798 0.04974 2.171 0.030010 *
southyes -0.09818 0.02876 -3.413 0.000651 ***
Diagnostic tests:
df1 df2 statistic p-value
Weak instruments (education) 3 3003 8.008 2.58e-05 ***
Weak instruments (poly(experience, 2)1) 3 3003 1612.707 < 2e-16 ***
Weak instruments (poly(experience, 2)2) 3 3003 174.166 < 2e-16 ***
Wu-Hausman 2 3001 0.841 0.432
Sargan 0 NA NA NA
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4032 on 3003 degrees of freedom
Multiple R-Squared: 0.1764, Adjusted R-squared: 0.1747
Wald test: 148.1 on 6 and 3003 DF, p-value: < 2.2e-16
操作変数法(IV法)を用いた分析の結果、教育年数が1年増加することによる賃金の上昇率(収益率)は約13.3%と推定された。教育の係数は統計的に有意であり(p<0.01)、通常の回帰分析(OLS)で算出された約7.4%という数値と比較して、教育の純粋な効果は倍近く高い可能性があることを示している。これは、経済的な事情などで進学を迷い、大学が近くにあるかどうかという環境要因によって進路が変わった層(LATE)において、教育を受けるメリットが特に大きかったことを示唆する結果である。
その他の要因については、経験年数は賃金を上昇させる効果が認められるものの、OLSで有意だった二乗項(キャリア後半での頭打ち傾向)や人種(アフリカ系)によるマイナスの影響は、このモデルでは統計的に有意とはならなかった。一方で、地域要因は依然として強く影響しており、都市部居住は約10.8%の賃金上昇、南部居住は約9.8%の賃金低下をもたらすという有意な結果が得られている。
モデルの妥当性を示す診断検定を確認すると、操作変数は教育年数と統計的に有意な関連を持っており(弱操作変数検定)、分析の前提は満たされている。しかし、Wu-Hausman検定の結果は有意ではなく(p=0.432)、OLSとIVの推定値の間に統計的に明確な差があるとは断定できない結果となった。つまり、点推定値としては13.3%という高い効果が示されたものの、標準誤差の大きさなどを考慮すると、OLSの結果が完全に間違っていた(バイアスがあった)とまでは統計的に言い切れないという、慎重な解釈が必要な結論となっている。
Wu-Hausman検定
Wu-Hausman検定(ハウスマン検定)は、モデルにおける「内生性」の有無、つまり通常の最小二乗法(OLS)と操作変数法(IV法)の結果に統計的に有意な差があるかを判定する手法である。帰無仮説は「OLS推定量は一致推定量である(内生性はない)」とする。検定が有意であればOLSはバイアスを含んでいるためIV法を採用すべきだが、有意でなければ、より推定精度の高い(分散が小さい)OLSを採用することが正当化される。
- Wu, D. M. (1973). Alternative Tests of Independence between Stochastic Regressors and Disturbances. Econometrica, 41(4), 733-750.
- Hausman, J. A. (1978). Specification Tests in Econometrics. Econometrica, 46(6), 1251-1271.
ivregパッケージではsummary関数の引数diagnostics = TRUEを指定することで実行される。
Sargan検定(過剰識別制約検定)
Sargan検定は、使用した操作変数が本当に「外生的」であるか(誤差項と無相関であるか)を検証する手法である。この検定を行うには、内生変数の数よりも操作変数の数が多い「過剰識別」の状態が必要である。帰無仮説は「すべての操作変数は有効(外生的)である」とする。もし結果が有意になった場合、少なくとも一つの操作変数が不適切であり、モデルの設定自体に誤りがある可能性が高いことを示唆する。
※注意:今回のモデルのように操作変数の数と内生変数の数が同じ(ちょうど識別されている)場合、自由度が0となるため検定不能(NA)となる。
弱操作変数検定(Weak Instruments Test)
弱操作変数検定は、選んだ操作変数が内生変数に対して十分な説明力(相関)を持っているかを確認する手法である。操作変数の相関が弱い(Weak IV)場合、IV推定値のバイアスが大きくなり、信頼区間が不正確になるなど、分析結果の信頼性が損なわれる。一般的に、第一段階の回帰分析におけるF統計量が「10」を超えるかどうかが、操作変数が十分に強いかどうかの目安として用いられることが多い。
これもdiagnostics = TRUEで出力される。特に「Weak instruments」の行のF値(statistic)に注目する。
Diagnostic tests:
df1 df2 statistic p-value
Weak instruments (education) 3 3003 8.008 2.58e-05 ***
計量経済学には、「第一段階のF値が10を超えていれば、操作変数は十分に強い」という経験則(Stock & Yogoの基準)がある。 今回の結果を見ると、education の statistic(F値)は 8.008 である。 これは基準の10を下回っているため、「弱操作変数(Weak Instruments)の問題」が懸念されるラインである。
Pr(>|t|)(p値)を見ると 2.58e-05 と非常に小さく、星3つ(*)がついている。 これは「操作変数(大学の近さ)と教育年数は、無関係ではない(確実に関連はある)」ことを意味する。 しかし、IV分析においては「単に関連がある(0ではない)」だけでは不十分で、「強く関連している」**ことが求められる。F値8.008という数字は、「関連はあるが、推定値を安定させるほどの力強さには欠ける」という状態を示している。
操作変数が弱い場合、以下のリスクが生じる。 - IV推定値(今回の約13.3%)が、バイアスを含んでいる可能性がある。 - 推定値のばらつき(標準誤差)が大きくなり、正しい検定ができなくなる(実際にHausman検定で差が出なかったのは、この「弱さ」により標準誤差が膨らんだことが一因である可能性がある)。
双極症の論文
https://ides.hatenablog.com/entry/2026/01/12/004945
この論文で採用された操作変数(Instrumental Variable)は地域レベルでのSSRI処方傾向 Regional-level SSRI prescribing propensityである。 処方に積極的な地域の医師にかかれば、患者がSSRIを処方される確率は高くなる(関連性)。一方で、患者が「どの地域に住んでいるか」や「どの医師にかかるか」は、患者本人のうつ病の重症度とは関係のない「偶然(運)」の要素が強い。重症だからといって処方率が高い地域に引っ越すわけではないからだ(外生性)。
という相反する結果であった。 Wu-Hausman検定(あるいはそれに準ずるエンドジェネイティ検定)はOLSの結果を棄却するために利用されている。