1. 固定効果 (Fixed Effects)
- 母集団全体で共通の効果 を持つと考えられる変数。
- 関心があるのは、その効果の大きさや方向性 であり、異なる水準 (レベル) 間の差を推定し、比較する。
- 通常、固定効果の係数は、従来の回帰分析と同様に解釈される。
例:
- 性別 (男性/女性) の効果: 数学の成績に対する性別の影響を調べたい場合、性別は固定効果となる。この場合、男性と女性の数学の成績の平均的な差に関心がある。
- 教育方法 (A/B/C) の効果: 異なる教育方法が学力に与える影響を調べたい場合、教育方法は固定効果となる。教育方法 A, B, C の間の学力の平均的な差に関心がある。
- 薬の投与量 (0mg/10mg/20mg) の効果: 薬の投与量が症状の改善に与える影響を調べたい場合、投与量は固定効果となる。各投与量における症状の平均的な改善度の差に関心がある。
2. ランダム効果 (Random Effects)
- 母集団からランダムに抽出された水準 (レベル) に関連付けられた効果 を持つ変数。
- 関心があるのは、その効果の大きさではなく、水準間のばらつき (分散) の大きさ。
- ランダム効果を導入することで、水準内の観測値間の相関 をモデル化することができる。
例:
* 学校の効果: 複数の学校から生徒を抽出して数学の成績を調べるとする。学校によって教育の質や環境が異なるため、数学の成績に差が生じると考えられる。この場合、学校はランダム効果となる。個々の学校の効果の大きさには関心がなく、学校間の成績のばらつきの大きさに関心がある。
* 生徒の効果: 同じ生徒から繰り返し測定されたデータがある場合、生徒はランダム効果となる。個々の生徒の能力には関心がなく、生徒間のばらつきの大きさに関心がある。
* 地域/国の効果: 複数の地域や国からデータを収集した場合、地域や国はランダム効果となる。個々の地域や国の効果には関心がなく、地域間/国間のばらつきの大きさに関心がある。
3. 固定効果とランダム効果の違いのまとめ
特徴 | 固定効果 | ランダム効果 |
---|---|---|
関心の対象 | 効果の大きさ、水準間の差 | 水準間のばらつき (分散) |
水準 | 母集団におけるすべての水準、または関心のあるすべての水準 | 母集団からランダムに抽出された水準 |
推定 | 各水準の効果を推定 | 分散を推定 |
仮定 | 効果は固定されている | 効果は確率変数であり、特定の分布に従う (通常は正規分布) |
例 | 性別、教育方法、薬の投与量 | 学校、生徒、地域、国 |
ポイント:
- ランダム効果を導入することで、階層データの構造 (例:生徒が学校にネストされている) を適切にモデル化し、標準誤差の過小評価を防ぐ ことができる。
- 固定効果とランダム効果のどちらを選択するかは、研究の目的、データの構造、理論的な背景 に基づいて決定する必要がある。
- 同じ変数を、異なる研究で固定効果として扱うことも、ランダム効果として扱うこともあり得る。
4.ランダム効果の「ランダム」
ランダム効果が「ランダム」と呼ばれるのは、母集団からランダムに抽出された水準(レベル)に基づいているためである。ここでいう「ランダム」とは、個々の水準が特定の法則や意図によって選ばれるのではなく、確率的な要素に基づいて選ばれることを意味している。
例えば、「学校」をランダム効果として扱う場合、分析対象の学校は全国に存在する無数の学校の一部であり、その学校が母集団(全国の学校)からランダムに選ばれたサンプルであると仮定する。この仮定により、分析結果を特定の学校に限定せず、母集団全体に一般化することが可能となる。
また、ランダム効果自体が確率変数として扱われることも理由の一つである。個々の水準(例:学校ごとの成績差)は固定された値ではなく、正規分布などの特定の分布に従うと仮定する。このため、ランダム効果はその水準ごとの「効果の大きさ」ではなく、水準間のばらつき(分散)に焦点を当てて分析される。
5. ランダム効果モデルのバリエーション
5.1. ランダム効果モデル(Random Effects Model)
ランダム効果モデルは、母集団からランダムに抽出されたグループや個体に関連する効果を考慮する統計モデルである。このモデルでは、グループ間のばらつきを説明するために、固定効果(全体に共通する効果)とランダム効果(グループ固有のばらつき)の両方を組み込むことができる。
ランダム効果モデルの一般形:
このモデルには、ランダム切片だけでなく、ランダム傾き(Random Slopes) も含めることができる。
5.2. ランダム切片モデル(Random Intercept Model)
ランダム切片モデルは、ランダム効果モデルの中でも特に「切片」のみがグループごとにランダムに変動するモデル である。ランダム切片は、グループごとの切片が特定の分布(多くの場合は正規分布)から引かれる確率変数とされる。
ランダム切片モデルの特徴:
- 各グループごとに異なる切片を持つ
- ただし、傾き(説明変数の効果)は全グループで共通とする
モデルの例:
ここで、
- は全体の平均的な切片(固定効果)
- はグループごとに異なるランダム切片(正規分布に従うランダム効果)
- 傾き は全グループで共通
このモデルでは、グループ間の平均の違いをランダムなばらつきとしてモデル化する。
このモデルでは、各グループ の切片は で表される。ここで が正規分布に基づくランダムな値なので、グループごとの切片も観測ごとに異なる可能性がある不確実なものとなる。
ランダム切片が「ランダム」と呼ばれる根本的な理由は、その切片が確定的な定数ではなく、確率分布に基づいて「偶然性(不確実性)」を持つ変数として扱われるからである。ここでの「ランダム」という概念は、統計学における「確率的な変動」を意味するものである。
5.3. ランダム傾きモデル(Random Slope Model)
概要:
このモデルでは、切片は全グループで共通だが、傾きがグループごとに異なる。つまり、グループごとに変化の強さや方向性が異なることを想定している。
数式:
特徴:
- 傾きがグループごとに異なるため、データの変化のパターンが異なることを反映
- 切片は全グループで共通
5.4. ランダム切片・傾きモデル(Random Intercept and Slope Model)
概要:
このモデルは、切片と傾きの両方がグループごとにランダムに変動するモデルである。最も柔軟性が高く、グループごとに異なる「出発点」と「変化のパターン」を考慮できる。
数式:
- :全体の平均的な切片(固定効果)
- :グループごとのランダム切片
- :全体の平均的な傾き(固定効果)
- :グループごとのランダム傾き
- :誤差項
特徴:
- 切片と傾きの両方がグループごとに異なる
- 切片と傾きの間に相関がある場合もモデリング可能
5.5. のモデルの比較表
特徴 | ランダム切片モデル | ランダム傾きモデル | ランダム切片・傾きモデル |
---|---|---|---|
切片の扱い | グループごとに異なる(ランダム切片) | 全グループで共通 | グループごとに異なる(ランダム切片) |
傾きの扱い | 全グループで共通 | グループごとに異なる(ランダム傾き) | グループごとに異なる(ランダム傾き) |
数式 | |||
モデルの柔軟性 | 低い(シンプル) | 中程度(傾きに柔軟性) | 高い(切片と傾きの両方に柔軟性) |
推定するランダム効果の数 | 1(切片のみ) | 1(傾きのみ) | 2(切片と傾き) |
適用例 | 学校ごとの成績の平均値が異なるが、勉強時間の効果は同じ | 勉強時間の効果が学校ごとに異なるが、成績の基準値は同じ | 学校ごとに成績の基準値も勉強時間の効果も異なる |
切片と傾きの相関 | なし | なし | あり(相関もモデル化できる) |
6.正規分布に関して
6.1.ランダム切片の場合
ランダム切片やランダム傾きが「正規分布する」とは、グループごとの効果(切片や傾きの偏差部分)が正規分布に従うことを意味する。 ここで重要なのは、観測データそのものが正規分布するわけではないという点である。正規分布するのは、固定効果からのずれ(偏差)である。
ランダム切片モデルは次のように表されます:
- :全体の共通切片(固定効果)
- :グループ のランダム切片(偏差)
- :誤差項(個々のデータポイントのばらつき)
ここで、 とします。
つまり、「学校ごとの平均成績が全体の平均からどのくらいズレているか」 が、平均0、分散 の正規分布に従うという仮定である。多くの学校は平均に近い成績を持つが、少数の学校はそれよりも高いか低い成績を示すというばらつきを表現する。
6.2.ランダム傾きの場合
ランダム傾きモデルでは次のように表される:
- :全体の平均的な傾き(固定効果)
- :グループごとのランダム傾き(偏差)
ここで正規分布するのは、「各グループの傾きが全体の平均傾きからどのくらいズレているか」(=)である。つまり、
多くのグループでは平均的な傾きに近い効果が観測されるが、一部のグループでは「より強い」または「より弱い」傾きを持つことがある、というばらつきを表現する。
6.3. ランダム切片・傾きモデルの場合
このモデルでは、切片と傾きの偏差がそれぞれ正規分布に従い、さらに切片と傾きの偏差に相関がある場合も考慮できる:
ここで、
このモデルでは、切片と傾きがどの程度一緒に変動するか(共分散)も考慮されます。たとえば、「平均成績が高い学校ほど、勉強時間の効果も大きい」といった関係がある場合である。
6.4. なぜ正規分布を仮定するのか?
- 中心極限定理: 多くのランダムな要因が積み重なることで、結果として正規分布に近づくとされる。教育の質、教師の影響、地域環境など複数の要因が学校ごとの偏差に影響する場合、自然に正規分布に近づくと考えられる。
- 計算の簡便性: 正規分布は解析的に扱いやすく、推定や解釈が容易になる。
- 推定の安定性: 正規分布を仮定することで、モデルの収束がしやすくなり、信頼区間や検定が行いやすくなる。
6.4.1. 母集団のばらつきを簡潔に表現するためのモデル化
- この仮定は、「学校ごとの成績の違いは、偶然的な要因(ランダムな揺らぎ)によって生じる」と考える立場に基づいている。
- 具体的には、教育環境、教師の質、生徒構成、地域特性など、無数の要因が重なった結果として学校ごとの差が生まれると考える。
- 複数の小さな要因の積み重ねは、中心極限定理により正規分布に近づくため、合理的な仮定とされいる。
6.4.2 推定や解析を数学的に簡単にする
6.4.3 一般化可能な結果を得るため
- 正規分布を仮定することで、サンプルデータだけでなく、母集団全体への推論がしやすくなる。
- 例えば、特定の学校だけでなく、全国の学校全体について成績のばらつきを推測できる。
6.5. ランダムの仮定が正しい場合
以下の条件が満たされている場合、この仮定は合理的で正しく機能することが多い。
6.5.1 ランダム効果が多くの独立した小さな要因によって決まる場合
- 中心極限定理(Central Limit Theorem) が適用される場面。
- 例:学校の成績差が「教師の指導力」「生徒の家庭環境」「学校の設備」など、無数の小さな独立要因の組み合わせによるものであれば、自然と正規分布に近づくことが期待できる。
6.5.2 グループ間の差が極端でない場合
- 学校ごとの差が大きく偏っておらず、「平均付近に多くの学校が集まり、極端に高い・低い学校は少ない」という分布であれば、正規分布の仮定は合理的だと考えられる。
6.5.3 データが階層構造に適している場合
- 生徒が学校にネストされるような階層構造データで、グループ内の観測が相関している場合には、ランダム効果モデルが強力に機能する。
6.6. 仮定が誤る可能性がある場合(正規分布仮定の限界)
6.6.1 グループ間のばらつきが非対称または極端に偏っている場合
- 例:ある学校は極端に成績が良く、別の学校は極端に悪い、「二峰性分布」や「歪んだ分布」になっている場合。
- 正規分布は対称性が前提なので、こうした場合には仮定が破綻する。
6.6.2 グループ数が非常に少ない場合
- 学校が3~4校程度しかない場合、「母集団からランダムに抽出された」と考えるのは無理がある。
- 正規分布を仮定しても、推定値が不安定になり、誤った結論を導く可能性がある。
6.6.3 ランダム効果が実は固定的な特徴に基づいている場合
- もし学校間の差が偶然ではなく、「特定の教育方針」や「政策」などの固定要因によって生じているなら、ランダム効果として扱うのは不適切となる。
- この場合、固定効果モデルの方が適している。
6.6.4 外れ値の存在
- 一部の学校だけが極端なパフォーマンスを示す外れ値(アウトライヤー)が存在する場合、正規分布の仮定が崩れる。
- 外れ値は、推定値や分散の計算に大きな影響を与えるため、別の分布(t分布やロバストな分布)を検討する必要がある。
6.7 仮定の検証方法
仮定が正しいかどうかを確認するためには、いくつかの方法がある。
ランダム効果の残差プロット:
ランダム効果の残差が正規分布に従っているかを確認する。QQプロットを使用することが一般的。Shapiro-Wilk検定やKolmogorov-Smirnov検定 正規性を統計的に検定する方法。
分布の推定と比較:
正規分布以外の分布(例:ガンマ分布、ロジスティック分布)と比較して、より適切なモデルを選択する。
7. 最適なランダム効果モデルを選択するポイント
7.1. モデル選択の基本的な考え方
7.1.1. モデルの柔軟性と複雑さのバランス
- ランダム切片・傾きモデルは最も柔軟ですが、複雑さも増す。
- 切片と傾きの両方にランダム効果を導入すると、パラメータ数が増加し、モデルの推定が難しくなる。
- データ数が少ない場合や、グループ数が十分でない場合、過剰適合(オーバーフィッティング)のリスクが高まる。
7.1.2. データの構造に基づいた選択**
グループ内の相関が「平均値の違い」に由来する場合: → ランダム切片モデルで十分対応可能。
- 例:学校ごとに成績の「基準値」は違うが、勉強時間の効果は変わらない場合。
グループごとに「変化の傾向(傾き)」も異なる場合: → ランダム切片・傾きモデルが適切。
- 例:学校ごとに「勉強時間が成績に与える効果の強さ」も異なる場合。
7.1.3. 統計的な適合度の評価
7.2. 各モデルの特徴と使い分け
モデル | 特徴 | 適した場面 |
---|---|---|
ランダム切片モデル | グループごとに切片が異なるが、傾きは共通 | グループ間で「平均値の違い」だけが存在する場合 |
ランダム傾きモデル | グループごとの傾きが異なるが、切片は共通 | グループ間で「変化のパターン(傾き)」だけが異なる場合 |
ランダム切片・傾きモデル | 切片と傾きの両方がグループごとに異なる | グループ間で「平均値の違い」と「変化のパターンの違い」両方が存在する場合 |
ランダム効果モデル(全体) | 上記すべてのモデルを含む広義の概念 | データと目的に応じて適切なモデルを選択する必要がある |
7.3. ランダム切片・傾きモデルが最適な場合とそうでない場合
7.3.1. 最適な場合(使用が推奨される場面)
- グループごとの成績の「基準値」も「変化の傾き」も異なることが理論的に予想される場合
- 例:学校ごとに成績の平均が異なり、さらに「勉強時間の効果」も異なる
- 十分なデータ量があり、推定が安定する場合
- グループ数が多く、観測数も多いとき(例:数十以上の学校、数百人以上の生徒)
7.3.2. 適さない場合(避けた方がよい場面)
- データ量が少ない場合
- パラメータが多すぎると推定が不安定になる
- 傾きに実際の差がない場合
- 不必要にモデルを複雑化すると、過剰適合のリスクが高まる
- モデルが収束しない場合
- 推定アルゴリズムが複雑さに耐えきれず、結果が不安定になることがある
8. ヌルモデルの構築
8.1. ヌルモデル(Null Model)とは?
ヌルモデル(Null Model) とは、説明変数(予測変数)を一切含まない、最も単純な統計モデルのことである。
このモデルは、「何の説明も加えなかった場合にどれだけデータを説明できるか」を示す基準モデルとして使用される。
8.2. ヌルモデルの数式
8.2.1. 線形回帰におけるヌルモデル
- :全体の平均
- :グループごとのランダム効果(例:学校ごとのばらつき)
- :個々の誤差項
このモデルでは、「全体の平均値」だけでデータを予測するという非常に単純なアプローチを取る。
8.2.2. 階層線形モデルにおけるヌルモデル(ランダム効果を含む場合)
階層構造(例:生徒が学校にネストされる場合)の場合、次のようになる。
- :全体の平均
- :グループごとのランダム効果(例:学校ごとのばらつき)
- :個々の誤差項
ここでは、説明変数が一切含まれていないにもかかわらず、グループごとのばらつき(ランダム効果)を考慮することがポイントである。
8.3. ヌルモデルの目的と役割
8.3.1. モデルの基準点としての役割
- ヌルモデルは、より複雑なモデルがどれだけ説明力を向上させているかを評価するための基準となる。
- 例えば、説明変数を追加する前後でAIC(赤池情報量基準)やR²(決定係数)がどれだけ改善されたかを確認する際の比較対象である。
8.3.2. 分散成分の確認(階層モデルの場合)
これにより、どの程度の分散がグループ間で説明されるかがわかる。
もしICCが高ければ、グループ間の違いが大きいことを意味し、階層構造を考慮する必要性が示唆される。
8.3.3. 有意性検定の基準モデルとして
- 尤度比検定(Likelihood Ratio Test)において、ヌルモデルは対立モデルと比較され、説明変数の有無による有意差を検定する際の基準として使用される。
8.3.4. ヌルモデルとその他のモデルの比較
モデル | 特徴 | 用途 |
---|---|---|
ヌルモデル | 説明変数なし。定数項(平均値)のみ。 | ベースラインとしての比較、ICCの算出 |
ランダム切片モデル | 切片のみランダム効果を含む | グループ間の平均のばらつきを考慮 |
ランダム傾きモデル | 傾きのみランダム効果を含む | グループごとに異なる傾き(変化率)を考慮 |
ランダム切片・傾きモデル | 切片と傾きの両方にランダム効果を含む | 最も柔軟なモデル。複雑な階層構造に対応 |
固定効果モデル | グループ間の差異を固定効果として推定 | 各グループの個別の効果に関心がある場合 |
8.3.5. ヌルモデルの限界
- ヌルモデル自体はデータを説明する力がほとんどないため、単独で解釈することは少ない。
- 比較基準としてのみ使用されることが一般的
9. 固定効果モデルかランダム効果モデルか
9.1. 固定効果モデルが適している場合
9.1.1. グループ間の差に強い関心がある場合
- 各グループ(例:学校、個人)の違いを具体的に推定したい場合。
- 例:特定の学校ごとの成績の違いを知りたい場合、学校ごとに固定効果を推定する方が適切。
9.1.2. グループが母集団全体を網羅している場合
9.1.3. グループ内の変化や傾向に焦点を当てたい場合
- 時系列データやパネルデータ分析では、固定効果モデルが強力に機能する。
- 例:同じ個人の長期的な変化を分析したい場合、個人差を固定効果として扱う。
9.2. 固定効果モデルとランダム効果モデルの選択:Hausman検定
9.2.1. Hausman検定の概要
固定効果モデルとランダム効果モデルの選択を行う代表的な手法が、Hausman検定である。
目的:
「ランダム効果モデルが適切か、それとも固定効果モデルが適切か」を判断する。仮説:
- 帰無仮説(): ランダム効果モデルが適切である(ランダム効果と説明変数に相関がない)。
- 対立仮説(): 固定効果モデルが適切である(ランダム効果と説明変数に相関がある)。
解釈:
- p値が小さい(有意): 固定効果モデルが適切。
- p値が大きい(非有意): ランダム効果モデルで問題なし。
9.2.2. Hausman検定の数式
[ H = (\hat{\beta}{RE} - \hat{\beta}{FE})' [Var(\hat{\beta}{FE}) - Var(\hat{\beta}{RE})]^{-1} (\hat{\beta}{RE} - \hat{\beta}{FE}) ]
- ( \hat{\beta}_{RE} ):ランダム効果モデルの推定値
- ( \hat{\beta}_{FE} ):固定効果モデルの推定値
- ( Var(\cdot) ):推定値の分散共分散行列
この検定統計量 ( H ) は、カイ二乗分布に従う。
9.3. その他の検定方法
9.3.1. 尤度比検定(Likelihood Ratio Test)
- 目的: より単純なモデルと複雑なモデルを比較し、複雑なモデルの追加効果が有意かどうかを確認する。
適用場面:
- ランダム切片モデル vs ランダム切片・傾きモデル
- 固定効果モデルの階層間の比較
注意点:
尤度比検定は、ネストされたモデル(片方がもう一方の特別なケースである場合)に限って使用可能。
例:ランダム切片モデルは、ランダム切片・傾きモデルの特別なケースなので比較可能。
9.3.2. AIC / BIC(情報量基準)
9.3.3. 残差分析と診断プロット
- 目的: モデルの適合性を可視化して評価する。
- 方法:
- ランダム効果の残差プロット(QQプロット)で正規性の確認。
- 誤差のパターンや外れ値の確認。
9.4. モデル選択の実践的フロー
9.4.1. 理論的背景や研究目的に基づいて初期モデルを決定する
- 研究の目的を明確化:
- グループ効果が重要なら固定効果モデル。
- 母集団全体への一般化が目的ならランダム効果モデル。
- 階層構造がある場合は、ランダム切片モデルまたはランダム傾きモデルを検討。
9.4.2. ヌルモデルの構築
- ヌルモデル(Null Model)を作成:
- 説明変数なしのモデル(データ全体の平均値のみで予測)。
- 階層データの場合は、ランダム効果だけを含むヌルモデルも検討:
- 目的:
- 説明変数や階層構造がどれだけデータの説明力を向上させるかを評価するための基準モデル。
9.4.3. ヌルモデルとの比較による基本的な評価
尤度比検定(Likelihood Ratio Test)を実施:
- ヌルモデル vs 説明変数を含むモデルを比較。
- p値が有意なら → 説明変数が有意に貢献していることが示される。
9.4.4. Hausman検定の実施(固定効果モデル vs ランダム効果モデル)
- Hausman検定でランダム効果モデルの適切性を評価:
- 帰無仮説(): ランダム効果モデルが適切。
対立仮説(): 固定効果モデルが適切。
解釈:
- p値が有意なら → 固定効果モデルが適切。
- p値が非有意なら → ランダム効果モデルが適切。
9.4.5. ネストされたモデル間の比較(尤度比検定)
- より複雑なモデル(例:ランダム切片・傾きモデル)と単純なモデル(例:ランダム切片モデル)を比較。
- 尤度比検定で追加した要素(ランダム傾きなど)の有効性を評価。
9.4.6. AIC/BICで複数のモデルを比較
9.4.7. 残差分析とモデル診断
- 残差プロットやQQプロットを使ってモデルの適合度を確認。
- 異常値(アウトライヤー)やモデルの誤差構造をチェック。
9.5. ヌルモデルを含めたモデル選択フローのまとめ
ステップ | ヌルモデルを含めたフロー |
---|---|
1. 初期モデルの決定 | 理論に基づき固定効果モデルまたはランダム効果モデルを選択 |
2. ヌルモデルの構築 | ヌルモデルを構築し、基準モデルとして設定 |
3. ICC(クラス内相関係数)の算出 | ヌルモデルを基にICCを算出し、階層構造の必要性を評価 |
4. ヌルモデルとの比較 | ヌルモデルと他のモデルを比較(尤度比検定、AIC/BIC) |
5. Hausman検定 | 固定効果モデルとランダム効果モデルを比較 |
6. ネストされたモデル比較 | 尤度比検定を用いて、ヌルモデルを含むネストされたモデル間の比較を強化 |
7. AIC/BICの比較 | ヌルモデルも含めた包括的な情報量基準による比較(尤度比検定は含まれない) |
8. 残差分析 | 残差分析を通じてモデルの適合度を確認 |