井出草平の研究ノート

ベイズ推定の利点

こちらの本の1.4.1 ベイズ推定の説明から。

1.4.1 Bayes estimator
ベイズ推定では、未知の真のモデルパラメータはランダム(不確実)と考えられ、データは固定されている。
従来の頻度論的アプローチと比較して、以下のような多くの利点がある(Lee and Song 2004; Yuan and MacKinnon 2009; Asparouhov and Muthén 2010c; Muthén 2010; Muthén and Asparouhov 2012a; Kaplan and Depaoli2012)

  1. ベイズ推定では、事前情報と新しいデータを組み合わせて、研究者の信念や過去の発見に基づいて現在のモデルに情報を与えることができる。
  2. ベイズ推定は、漸近的仮定に頼ることなく、小標本において優れた性能を発揮する。
  3. 頻度主義推定がパラメータを定数として扱うのに対し、ベイズ推定はパラメータを変数として扱い、パラメータシミュレーションの事後分布は、マルコフ連鎖モンテカルロ(MCMC)連鎖からランダムな抽出を繰り返し行うことによって構築される。このように、パラメータ推定の不確実性が考慮され、より現実的な予測が得られる(Asparouhov and Muthén 2010c)。
  4. ベイズ推定は、従来のアプローチでは推定できなかった、より複雑な構造(例えば、すべての交差因子負荷や誤差共分散に対する厳密なゼロ制約をCFAの近似ゼロに置き換える)でSEMを検査することを可能にする。
  5. 完全情報推定法であり、MARを仮定した最適な方法で、利用可能なすべてのデータを使用してモデリングを行う。
  6. ベイズ推定におけるシミュレーションされた欠損値は、Rubinの方法(1987)を用いて同時に分析できる欠損値の複数の入力(MI)に対して行われるので、欠損値の入力における不確実性を扱うことができる(Schafer 1997; Asparouhov and Muthén2010b)。ベイズ法からインプットされた因子スコアは、潜在変数の妥当値と呼ばれる。さらなる分析のために妥当な値を使用することで、従来の頻度主義的な分析のアプローチ(構成項目の総スコア、推定因子スコア、潜在クラスメンバーシップなど)と比較して、より正確なパラメータ推定値を得ることができる(Asparouhov and Muthén 2010d)。
  7. ベイズ推定は、連続結果とカテゴリカル結果の両方のモデル化に容易に使用できる。
  8. 不適切な解(負の残差分散のような「境界外」の推定値など)は、ベイズ推定では、不適切な解にゼロの確率を割り当てる事前分布を選択することで回避することができる。さらに、ベイズ推定では、動的構造方程式モデル(DSEM)のように、MLアプローチが実用的ではない新しいモデルを使用することができる(Asparouhov et al.2018)。しかし、ベイズ推定のための適切な事前分布を選択するには、スキルと経験が必要である。

ベイズ推定の利点をだいたい網羅できている記述ではないかと思う。

下記は雑談。

社会学は推定量そのものにあまり興味を持たない。例えば、気象学では、降水確率など推定量そのものが非常に大きな意味を持つが、社会学は、変数が有意になったか否かに興味を持つ。社会学者が推定量に興味がないわけではないが、実際のところ、やはり、有意になったか否かが重要だ。

そういう事情から、社会学では、ベイズ推定の利点はないのではないかと、ここ何年かは考えていた。しかし、最近、実際に分析でベイズ推定を使ってみたところ、どうもその考えが間違っているのではないかと思うようになった。

上記2の標本サイズに影響を受けない推定というのも魅力的だが、7のカテゴリカルな推定が実は肝なのではないかと感じている。もちろん頻度主義にもカテゴリカルな変数の推定方法があるので、わざわざベイズ推定を使う意味が無いようにも思えるし、実際、そう考えてきたのだが、分析をいくつかしてみると、精度がベイズ推定の方が高い印象を持った。

ベイズ主義と頻度主義は一概に比べられるものでもなく、標本サイズなど諸条件も関係していて、違いがあったとしても、ベイズ推定がカテゴリカルデータに強いという理由から来ているのかはわからない。標準誤差のようなわかりやすい指標で比べられないわけでもない。結局のところ分析をしてみた印象にとどまるので、今後、分析するときにベイズ推定もしてみて、使い道を探っていきたいとは思っている。