カイザー基準についてのメモ

因子分析の勉強メモ。

カイザー基準は、カイザー・ガットマン基準と呼ぶこともある。これはKaiser(1960)よりも先にGutttman(1954)が先に指摘があったため、連名での表現である。

固有値が1以上のものを因子とする方法である。それは、1つの因子にしか負荷しない因子(独自因子)は最大1であるためである。

f:id:iDES:20190319093630p:plain

先のエントリーで描いたScreeの1のところに引いてあるラインが固有値1のカイザー基準である。

カイザー基準は標本誤差の問題を無視したもので, サンプルサイズが無限のときに正しい(Horn,1965)。標本誤差を含む時,基準は因子数を多く推論してしまう。(堀 2005)

因子間相関が高いと因子数を過小に推測してしまうことがある。 Cattell& Vogelmann(1977)の人工データにおいてはカイザー基準が15中9も過小推定している。(堀 2005)

サンプルが多い研究というのはそれほど多くないので、代替の場合、標準誤差という観点から見ると、因子数が多く推論し、因子間の相関が高いと少なく推論するという特徴があるようだ。であれば、最低基準にも最高基準にもならないということになる。

相関行列の固有分解から得られる固有値を大きいものから順に1.0以上の値を示す個数を因子の数とするのがGuttman 基準あるいはKaiser-Guttman基準であった(Kaiser, 1960; Guttman, 1954)。Cattell(1966)によるScreeは、固有値の値を最大から最小へとグラフで表し、前後の落差の大きいところで因子数を決める方法である。これらの方法の問題点は、対角項に共通性ではなく、1.0を置いた相関行列を対象としていることにある。  主因子解の第1因子は、対角項が共通性からなる相関行列の固有値固有ベクトルから計算される。第2因子は、第1因子の残差行列を対象とした固有分解から計算される。以降の因子も残差行列から固有値固有ベクトルの計算により抽出されることになる。これに対して、観測変数の独自性ではなく、観測変数にランダム誤差を仮定した主成分分析法 による第1主成分は、対角項が1 からなる相関行列から計算される。  固有値の値を手がかりとするKaiser-Guttman基準やScree は、このようにみてみると、因子ではなく主成分を対象としていることになる。(清水 2018)

Screeの話も出てきているが、両方の技法とも対角項に1を置いた相関行列で計算されている点が問題のようだ。引用に書いてあるように、これは主成分の分析である。

簡単に言えば因子分析をして妥当な因子数を探っているにも関わらず、その手法が主成分を対象にしているのであれば、ちぐはぐである。

主成分分析と因子分析は別の分析ですと言いながら、因子数をカイザー基準で決めるというのは、ダブルスタンダードとも言える。Screeには使い道があるようだが、カイザー基準はあまり役に立たないようだ。