因子分析のサンプルサイズは項目数×7で求められるのか

時々気になるサンプルサイズの話である。

pubmed.ncbi.nlm.nih.gov

サンプルサイズのについての記述

Henrica et al.(2005)では、下記のように書かれてある。

サンプルサイズ探索的因子分析も確認的因子分析も、信頼できる結果を得るためには相応のデータ量が必要である。最小限の要件に関する議論は現在も進行中である(Floyd & Widaman 1995) 。基本的なルールは、変数あたりの被験者数が4～10人で、分散-共分散行列の安定性を確保するための最小被験者数は100人である(Kline 1993)。変数あたりの必要な被験者数は、とりわけ、因子負荷、因子あたりの変数の数(Guadagnoli & Velicer 1998)、および総標本サイズに依存し、標本サイズが小さいほど、変数あたりの被験者数が多く必要になる(Streiner 1994)。我々は、1項目あたりの被験者数を7人に設定することにした。SF-36では、これは1次の因子分析（35の個別項目に焦点を当てる）では、少なくとも245人の被験者が利用可能でなければならないことを意味する。8サブスケールの2次分析では、56人の被験者がいれば十分だが、その場合は最低100人の被験者がいればよいという基本的なルールを適用した。

Floyd FJ, Widaman KF. Factor analysis in the development and refinement of clinical assessment instruments. Psychol Assess 1995; 7: 286–299.
Kline P. The Handbook of Psychological Testing. London: Routledge, 1993.
Guadagnoli E, Velicer WF. Relation of sample size to the stability of component patterns. Psychol Bull 1988; 103: 265–275.
Streiner DL. Figuring out factors: The use and misuse of factor analysis. Can J Psychiatry 1994; 39: 135–140.

100ルール

主成分法を使っていた頃はサンプルサイズと変数の数を3対1にすることが推奨されていた(Cattell 1978)。ただ、現在、因子分析をする場合は最尤法、もしくは最尤法の応用をする推定法を使うため大きなサンプルサイズが必要ということはない。最低100という提示はKline(1993)の他に、Gorsuch(1985)にもある。
100人という数値基準はCOSMINにも記載されている。

https://www.cosmin.nl/wp-content/uploads/COSMIN-study-designing-checklist_final.pdf

Cattell, R. B. （1978）. The scientific use of factor analysis in behavioral and life science. New York, NY: Plenum.
Gorsuch, R. L. （1983）. Factor analysis. （2nd ed.） Hillsdale, NJ: Lawrence Erlbaum.

変数とサンプルサイズ

Guadagnoli & Velicer(1998)は下記のように述べている。

N: サンプルサイズ
p: 変数の数

最もポピュラーなルールは、N/p比であるが、この方法はまったく実証されていない。この規則に従えば変数が多ければ、より大きいサンプルサイズが要求されるが、実証的調査からの結果からは逆の関係があることが分かった。変数の数が増えるとより大きなサンプルサイズが必要になるという考え方は明らかな誤りである。

N/p比はCattell(1978)的な方法である。Cattell(1978)は主成分の話であって、ここで問題にされているのは、最尤法でも同じようなことをしている人たちがいるが、間違いだとGuadagnoli & Velicer(1998)は述べている。

このエントリの最初に登場したSF-36の因子分析をしたHenrica et al.(2005)はGuadagnoli & Velicer(1998)を引用しつつ、N/p比を7にするという書いている。引用した文献に「明らかな誤り」とされた方法を採用していているので、やらかしているわけだ。Henrica et al.(2005)を根拠にN/p比を持ち出してきている論文などもあるので、困った状況ではある。

彼らのことはさておき、項目数×7=サンプルサイズのようなことを私たちはしてはいけない。

他の見解

Velicer et al.(1982)は、2つの方法から得られた解の差がわずかであることを発見したことに加えて、サンプル因子パターンとその集団パターンとの一致がN=144レベルで非常に良好であることも報告している。Boomsma(1982)は、構造方程式モデルリングで分析のサンプルサイズが100個未満では実効するべきではなく、200以上が必要だと述べている。

Velicer, W. E, Peacock, A. C., & Jackson, D. N. (1982). A comparison of component and factor patterns: A Monte Carlo approach. Multivariate Behavioral Research, 17, 371-388.
Boomsma, A. (1982). The robustness of LISREL against small sample sizes in factor analysis models. In K. G. Joreskorg & H. Wold (Eds.), Systems under indirect observation (Part 1, pp. 149-173). Amsterdam: North-Holland.

Guadagnoli & Velicer(1998)の推奨

Guadagnoli & Velicer(1998)はどのような提案をしているのだろうか。
事前の情報がない場合、因子を表す変数を10以上用意するとサンプルサイズは150で十分。負荷量が0.60を超える4つ以上の変数が因子を構成している場合には、サンプルサイズは少なくてもよい。 p/mが低ければ、母集団のパターンを再現するために、より大きなサンプルサイズが必要になる。

p: 変数の数 m: 因子分析の結果できた因子の数

ではどうすればいいのか

日本語では、清水和秋(2018)でも扱われている話題で、要約すると「わからん」ということなのだが、暫定的な解として以下の3つが提示されている。

ここでの暫定的な答えは、Gorsuch（1985）が提示している「最低数は100で、できるだけ多く」かもしれない。そして、可能であれば標本計画に従ったランダムサンプリングを実施することではないだろうか。もう一つの回答は、印東（1974）が言及していたように、因子的不変性の検証である（Nesselroade & Baltes, 1984; 清水，2013）。

清水和秋(2018)「因子分析的研究におけるmisuseとartifact」『関西大学社会学部紀要』 49(2): 191-211.
印東太郎（1974）．心理学における統計学の適用応用統計学， 4, 1 -16
Nesselroade, J. R., & Baltes, P. B. （1984）. From traditional factor analysis to structural-causal modeling in developmental research. In V. Sarris & A. Parducci （Eds.） Perspectives in psychological experimentation: Toward the year 2000 （pp.267–287）. Hillsdale, NJ: Erlbaum.
清水和秋（2013）．構造方程式モデリング日本パーソナリティ心理学会（企画）二宮克美・浮谷秀一・堀毛一也・安藤寿康・藤田圭一・塩谷真司・渡邊芳之（編集）パーソナリティ心理学ハンドブック（pp.669-675）福村出版．

清水和秋(2018)は以前にも取り上げたことがある。 ides.hatenablog.com