井出草平の研究ノート

因子分析と標本サイズ

清水和秋(2018)「因子分析的研究におけるmisuseとartifact」『関西大学社会学部紀要』 49(2): 191-211.

kansai-u.repo.nii.ac.jp

標本サイズ

Cattell(1978)は、標本サイズと分析対象の変数の数との比として、3 対 1 を目安としている。この比についての基準は、主因子法を主な因子解抽出の方法としていた時代に検討 されたものであった。この時代の因子分析法のテキストの中には、標本サイズと分析での 適切性について、50(very poor)、100(poor)、200(fair)、300(good)、500(very good)、 1,000以上(excellent)とするものもある(Comrey & Lee, 1992など)。Gorsuch(1985) は、最小の標本サイズを100としている。このような数値は、因子分析研究の蓄積の上で提案された経験則(rules of thumb)による目安にすぎない。実際の研究でのサイズについて、Henson & Roberts(2006)は、探索的因子分析法を使用している59論文を対象として 分析内容を精査し、標本サイズの中央値が267.00で、平均が436.08、標準偏差が540.74、 最小が43、最大が3,113であったと報告している。MacCallum, Widaman, Zhang, & Hong(1999)は、標本サイズ(60、100、200、400)と変数の数と因子の数との比(10: 3 、20: 3 、20: 7 )そして変数の共通性(低い、幅広い、高い)に関してモンテカルロ実験を行い、この 3 種類の違いが結果に影響することを明らかにし、因子に負荷する変数の数が少なく、 共通性も低い場合には、500を超えるサイズが必要ではないかとしている。そして、共通性 が高く、因子に負荷する項目も多い、質の良いデータの場合には、100を超える程度でも十分としている。同様の報告をMundfrom, Shaw, & Ke (2005)も行っている。彼らの結果を要約すると次のようになる。変数の共通性が高い場合、変数と因子の比が 8 の場合には サイズは100、この比が 6 の場合には250、 4 の場合に500となる。共通性が低い場合には、変数と因子との比が 8 の場合には130、 6 の場合には260、 4 の場合には1,400となる。  最尤法(Jöreskog, 1967)が本格的に使用されるようになってからは、標本サイズにつ いては「十分におおきな標本」という表現が使われるようになった。そして、主因子法に よる探索的因子分析法ではそれほど強調されなかった分析対象の変数が「多変量正規分布」 に従うことが最尤法を使用するための条件であると暗黙のうちに考えられてきた。Boomsma(1982)は、構造方程式モデリングのソフトであるLISRELを使って、100より少ない標本 サイズでの推定は危険であり、200以上を勧め、そして、分布が正規分布から乖離していて も頑健であることを示した。Browne(1984)による漸近的方法の提案は、観測変数の分布に関しては、正規分布に限定をする必要はないということであり、順序尺度水準やカテゴリー変数を対象として因子分析法を適用することも可能となってきた(市川,2010; 繁桝,1990)。  標本サイズについては明確な基準がない。加えて、モンテカルロ実験で明らかにされて きたサイズに影響する変数と因子の比や変数の共通性、そして、因子の構造は、因子分析 結果から見えてくるものである。研究計画や調査計画を立てている段階では、サイズを決 めるための情報は先行研究あるいは仮説段階の情報だけであり、十分な根拠を手にして調 査計画を立てることができるとは考えられない。この状況の中で、標本サイズの少ないと 思われるデータから抽出された因子をどのように評価すればよいのであろうか。artifactではないといえるようにするには、どのような方法でデータ処理をすればよいのであろうか。 ここでの暫定的な答えは、Gorsuch(1985)が提示している「最低数は100で、できるだけ多く」かもしれない。そして、可能であれば標本計画に従ったランダムサンプリングを実施することではないだろうか。もう一つの回答は、印東(1974)が言及していたように、因子的不変性の検証である(Nesselroade & Baltes, 1984; 清水,2013)

  • サンプルサイズは100以上でできるだけ多く
  • ランダムサンプリング
  • 因子的不変性の検証

ということらしい。

ランダムサンプリング

母集団からのランダムサンプリングで抽出したデータを分析の対象とする研究は、日本だけではなく、欧米でも、社会学や教育学の分野と比べると非常に少ない。

確かに心理系の尺度作成は大学生が対象であることが多い印象がある。大学生とは作成者の教員が受け持っている授業でデータを取って分析をしているということだ。大学生と一般人口の間に違いがなければ、問題はないが、だいたいの場合は、大学生(ほとんどの場合は1つの大学)の学生の特性を調べていることになるので、やはり問題であろう。

現代ではウェブ調査が比較的安価になっているので、ウェブ調査で尺度研究をするのはできないのかなと思った。

ランダムサンプリングというと、選挙人名簿→郵送のようなイメージがあるが、ウェブ調査でも全く問題はないと個人的には思う。ウェブ関連の質問をしない限り、郵送や訪問と違いが出るのは切片であって、因子分析に大きな影響を与えるとは思えないからだ。

  • Cattell, R. B. (1978). The scientific use of factor analysis in behavioral and life science. New York, NY: Plenum.
  • Gorsuch, R. L. (1983). Factor analysis. (2nd ed.) Hillsdale, NJ: Lawrence Erlbaum.
  • Henson, R. K., & Roberts, J. K. (2006). Use of exploratory factor analysis in published research: Common errors and some comment on improved practice. Educational and Psychological Measurement, 66, 393-416
  • MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sample size in factor analysis. Psychological Methods, 4, 84-99.
  • Mundfrom, D. J., Shaw, D. G., & Ke, T. L. (2005). Minimum sample size recommendations for conducting factor analyses. International Journal of Testing, 5, 159-168.
  • Jöreskog, K. G. (1971). Simultaneous factor analyisis in several populations. Psychometrika, 36, 409-426.
  • Boomsma, A. (1982). The robustness of LISREL against small sample sizes in factor analysis models. In K. G. Jöreskog & H. Wold (Eds.), Systems under indirect observation: Causality, structure, prediction (part 1)(pp. 149-173). Amsterdam: North-Holland.
  • Browne, M. W. (1984). Asymptotically distribution-free methods for the analysis of covariance structures. British Journal of Mathematical & Statistical Psychology, 37, 62-83.
  • 市川雅教(2010).因子分析 朝倉書店.
  • 繁桝算男(1990).カテゴリカルデータの因子分析.行動計量学,18, 41-51.
  • 印東 太郎(1974).心理学における統計学の適用 応用統計学, 4, 1 -16
  • Nesselroade, J. R., & Baltes, P. B. (1984). From traditional factor analysis to structural-causal modeling in developmental research. In V. Sarris & A. Parducci (Eds.) Perspectives in psychological xperimentation: Toward the year 2000 (pp.267–287). Hillsdale, NJ: Erlbaum.
  • 清水 和秋(2013).構造方程式モデリング 日本パーソナリティ心理学会(企画) 二宮 克美・浮谷 秀 一・堀毛 一也・安藤 寿康・藤田 圭一・塩谷 真司・渡邊 芳之(編集)パーソナリティ心理学ハンドブック(pp.669-675) 福村出版.