- Howard, M. C. (2016). A Review of Exploratory Factor Analysis Decisions and Overview of Current Practices: What We Are Doing and How Can We Improve? International Journal of Human-Computer Interaction, 32(1), 51–62. https://doi.org/10.1080/10447318.2015.1087664
要旨
サイバー心理学や人間とコンピュータの相互作用の分野の著者らは、測定や尺度の作成に特に興味を示している。探索的因子分析(EFA)は、これらの研究分野にとって極めて重要な統計的手法である。残念ながら、EFAにはいくつかの統計的および方法論的な決定が必要であり、その最善の選択肢は不明であることが多い。本稿では、5つの主要な決定事項を検討し、最善の実践方法について直接的な提案を行う。これらの決定とは、(a) データ検査技術、(b) 因子分析法、(c) 因子保持法、(d) 因子回転法、(e) 因子負荷カットオフである。次に、本記事では、サイバー心理学および/または人間とコンピュータの相互作用に関する7つの学術誌に掲載された関連論文の中から、これらの5つのEFA決定に関する著者の選択をレビューする。その結果、著者の大半が推奨されるベストプラクティスを採用していないことが明らかになった。特に、ほとんどの著者は仮定の違反についてデータを検査せず、不適切な因子分析法を適用し、時代遅れの因子保持法を利用し、因子回転法の正当化を省略している。さらに、多くの著者はEFAの決定を完全に省略している。これらの懸念を是正するために、本論文では著者が推奨されるベストプラクティスの使用を確実にできるように、段階的なガイドとチェックリストを提供している。本論文では、現在の研究における懸念を特定し、それらの懸念に対する直接的な解決策を提供している。
サイバー心理学や人間とコンピュータの相互作用の研究では、適切な尺度作成と評価方法が特に重要である。これらの分野では、技術と人間の認知、感情、人格との関係に関心があり、これらの人間的な特性は観察できない潜在構造として捉えられ、尺度を通じて測定される。しかし、これらの分野は比較的新しいため、多くの尺度の心理測定的特性や妥当性が十分に分析されておらず、研究者は信頼できる尺度が求められている。
尺度開発と評価には複数の段階があるが、理論的および心理測定的に適切な因子構造を特定することが特に重要である。その中で、探索的因子分析(EFA)は初期段階で因子構造を特定するために必要不可欠である。しかし、EFAを実施するにはいくつかの統計的および方法論的な決定が求められ、その選択が明確でない場合が多いため、不正確な結果が得られる可能性がある。
本論文は、サイバー心理学および人間とコンピュータの相互作用研究におけるEFAの適切な方法を特定することを目的としている。具体的には、(1) 適切なEFA方法のレビューを提供し、実施時に必要な決定事項を明示する、(2) 関連分野の7つの学術誌に掲載されたEFAの統計的および方法論的な選択を整理し、現在の実践を明確化する、(3) 過去のEFA決定に基づく共通の懸念を克服するための直接的な提案を行う、(4) 将来の研究と実践への示唆を述べる、という4つの目的を掲げている。
さらに本論文では、最先端のEFA手法(ベイジアン因子分析や探索的構造方程式モデリング)には焦点を当てず、SPSSやSASの一般的な知識があれば誰でも適用可能な方法に焦点を当てている。これにより、EFA実施時の一般的な課題に注意を向けることで、尺度開発と評価の未来を大きく改善することを目指している。
1. EFAの決定
探索的因子分析(EFA)を行う際には、いくつかの統計的および方法論的な決定が必要である。これらには、(a) データ検査技術、(b) 因子分析法、(c) 因子保持法、(d) 因子回転法、(e) 因子負荷カットオフの選定が含まれる。これらの決定は、EFA実施前に事前の理論や方法論的な論理に基づいて計画されるべきである。尺度の作成や評価の過程でこれらの決定を行い、複数の方法を試す場合、ファミリー単位の誤差率(familywise error rate)が増加し、第I種の誤りを犯すリスクが高まる(Benjamini & Hochberg, 1995)。
1.1. データ検査技術
さらに、これらの決定が科学的に正しい結果ではなく、都合の良い結果に基づいて選択される場合、科学的な倫理に明確に反する行為となる。なお、本レビューはすべてを網羅するものではない。各EFAの決定事項そのものが一冊の本に相当するほどの内容を含むため、一般の研究者にとって利用しやすい形で、EFAに関する基本的な助言を提供することを目的としている。
心理測定学の分野では、方法論や統計の改善が常に発見されており、最善の実践も絶えず変化している。このため、研究者はEFAプロセスに組み込まれる可能性のある新しい方法に常に注意を払うべきである。本論文では、これらの決定事項を次に詳しく検討する。
探索的因子分析(EFA)を行う際には、統計的な仮定の違反を確認するためにデータを検査することが重要である。この検査方法として、最も一般的なのは Bartlettの球面性検定(Bartlett’s test of sphericity)と KMO(Kaiser–Meyer–Olkin)サンプリング適合性指標 である。
Bartlettの球面性検定
この検定は、観測された相関行列が単位行列(対角成分以外がすべてゼロ)であるかどうかを確認するものである。因子分析は変数間の関係性を説明する手法であるため、データセット内に全く関係が存在しない場合(単位行列である場合)、EFAを行うことはできない。検定結果が有意であれば、データが単位行列ではなく、EFAを適用できることを意味する。ただし、この検定ではほとんどのデータセットが有意となるため、例外的な問題が検出される場合を除き、あまり使用されない傾向にある。KMOサンプリング適合性指標
この指標は、データセット内の共通分散を評価するものであり、潜在因子の存在可能性を示す。KMO値は次のような評価基準がある:- 0.00~0.50:不適(不十分)
- 0.50~0.60:不満足
- 0.60~0.70:やや満足
- 0.70~0.80:適度
- 0.80~0.90:優秀
- 0.90~1.00:非常に優秀
一般的に、EFAを実施する前にKMO値が 0.60以上 であることが推奨される。低い場合は、相関の低い変数を除去することで適合性を改善できる。
サンプルサイズの十分性
EFAの適用には十分なサンプルサイズが必要である。一般的な推奨としては以下の基準が挙げられる:- 参加者数は200~500人(共通性などの要因による)。
- 変数1つに対して参加者5~20人の比率を確保。
特に、最低200人または5:1の参加者対変数の比率 が支持される。これは保守的な基準と見なされることもあるが、本論文では多くのEFA応用においてこの基準を支持している。
これらの基準に従い、データがEFAに適しているかを検査することは、信頼性の高い結果を得るために不可欠である。(depending on communalities and other factors; Comrey & Lee, 1992; MacCallum, Widaman, Zhang, & Hong, 1999) and between a 5-to-20 and participant-to-variable ratio (Costello & Osborne, 2005; Hair, Black, Babin, Anderson, & Tatham, 2006; Velicer & Fava, 1998)
1.2. 因子分析法
因子分析法の選択は、探索的因子分析(EFA)において最も議論が多い部分の一つである。主な因子分析法には、主成分分析(PCA)、主軸因子法(PAF)、および最尤法(ML)が挙げられる。それぞれに長所と短所があり、慎重な選択が求められる。
1. 主成分分析(PCA)
PCAはSPSSのデフォルト設定であるため広く使用されているが、EFAの真の形式とは異なる手法であり、その適用は繰り返し批判されている。PCAは、変数間の相関構造を考慮せず、測定された変数の分散を最大限に説明することを目的としている。そのため、潜在構造を反映するのではなく、測定された変数の分散のみを説明する。また、PCAは共通分散と固有分散を区別せず、全ての分散を因子として扱うため、測定誤差を考慮しない不適切な仮定に基づくとされる。これらの理由から、EFAにおいてPCAを使用すべきではない。
2. 主軸因子法(PAF)
PAFは、相関行列の共通分散を再現する因子負荷を推定することを目的としている。この手法では、最終解に達するまで複数の統計的反復が必要であり、最終解は計算の容易さを重視して選ばれる。そのため、PAFの結果は回転を加えることで解釈可能性を向上させるべきである。また、PAFは固有分散(誤差)が正規分布に従うと仮定するが、変数間の線形関係や多変量正規性を仮定しないため、ほとんどの状況で正確な結果を提供できる。
3. 最尤法(ML)
MLは、観測データを最も生じやすい因子負荷と固有分散を推定する手法である。この手法も統計的反復を必要とし、最終解の回転が解釈可能性を高める。MLの特徴は以下の通りである: - 固有分散が正規分布に従うと仮定する。 - 変数が多変量正規分布であり線形関係を持つことを仮定する。 - PAFよりも不適切な解を生じる可能性があるが、それは稀である。 - モデル適合指標を提供し、仮説検定や複数のEFA解の直接比較が可能である。
これらの特性から、MLは他の手法より多くの情報を提供するが、より厳しい仮定を含む。
推奨事項
- PCAはEFAに使用しないこと。
- PAFとMLの使い分け:モデル適合指標に興味がない場合はPAFを使用し、興味がある場合はMLを使用する。ただし、MLの結果をPAFの結果と比較し、MLの仮定が違反されていないか確認すべきである。
- 他の因子分析法はあまり一般的ではなく、それぞれ固有の統計的仮定が存在する。いずれの方法を使用する場合でも、その長所と短所を理解することが重要である。
これらの選択は、信頼性の高いEFA結果を得るために不可欠である。
1.3. 因子リテンション法
探索的因子分析(EFA)の目的は、観測された相関行列を正確かつ理解しやすく説明する因子数を決定することである。この因子数は、不必要な因子を追加してもモデルが改善されず、逆に因子を削除するとモデルの性能が大幅に低下する状態が理想とされる。このため、因子保持(Factor Retention)の決定は慎重に行う必要があり、いくつかの方法が存在する。主な方法には、Kaiser基準、可視的スクリープロット(VSP)分析、並列分析、およびVelicerの最小平均部分(MAP)検定が含まれる。
1. Kaiser基準
Kaiser基準は、固有値が1を超える因子を保持するという簡易なルールである。しかし、この基準には理論的および実務的な問題点が指摘されている。特に、固有値が1.01と0.99のようにほぼ等しい場合でも保持の決定が異なるなどの矛盾があり、シミュレーション研究でもこの基準の正確性が低いことが示されている(Costello & Osborne, 2005)。そのため、現在ではこの基準の使用は推奨されない。
2. 可視的スクリープロット(VSP)分析
VSP分析では、固有値をグラフにプロットし、固有値の減少が目立たなくなる「肘点」までの因子を保持する。この方法は簡単で統計分析を必要としないため広く利用されているが、解釈の主観性が伴い、明確な基準を提供できない場合もある。それでも、Kaiser基準よりも精度が高く、心理測定学者の間では一般的に受け入れられている。
3. 並列分析
並列分析では、ランダムなデータセットを多数生成し、それらのデータセットに基づいて固有値を計算する。観測データの固有値がランダムデータの対応する固有値を上回る因子を保持する。この方法は理論的に堅牢であり、多くのシミュレーションでその正確性が支持されている。ただし、Kaiser基準と同様に、ほぼ等しい固有値で異なる決定が下される場合がある点は課題として残る。
4. VelicerのMAP検定
MAP検定は、相関行列の分散を段階的に部分化し、最小の平均二乗相関が得られるステップで因子数を決定する。この方法は因子保持の決定において高い正確性を示すが、因子数を過小評価する傾向があると指摘されている。
推奨事項
- Kaiser基準は使用しないこと。その代わりに、他の方法を選択する。
- VSP分析を並列分析、VelicerのMAP検定、またはその両方と併用すること。これにより、より正確な因子保持の決定が可能となる。
- 現在、これらの方法はアクセスが容易であり、広く利用可能なため、推奨される手法の組み合わせである。
これらの方法を適切に使用することで、因子保持の決定を改善し、EFAの精度を高めることができる。
1.4. 因子回転法
因子の数が決定された後、各変数の因子負荷を解釈する必要があるが、初期の因子行列は解釈が難しい場合が多い。このため、探索的因子分析(EFA)では回転を行い、解釈しやすい因子行列を得る。回転方法には、大きく分けて直交回転(orthogonal rotation) と 斜交回転(oblique rotation) の2つがある。
1. 直交回転
直交回転では、回転後の因子間の相関が許容されない。代表的な方法として quartimax と varimax がある。 - quartimax は最初に提案された回転法だが、実務上の欠点が多く、現在ではほとんど使用されない(Kaiser, 1958)。 - varimax は、因子負荷の分散を最大化し、大きな因子負荷と小さな因子負荷が明確に分かれるようにする方法である。このため、変数がどの因子に負荷しているかをはっきりと示しやすく、広く使用されている。
ただし、直交回転は因子間の相関を認めないため、多次元的な尺度や因子間の関連性がある場合には適切でないことが多い。
2. 斜交回転
斜交回転では、回転後の因子間の相関が許容される。このため、多次元的で因子間に関連がある場合に適している。代表的な方法として promax と direct oblimin がある。 - promax は、まず varimax を実行した後、因子負荷を特定のべき乗(通常は4)で上昇させ、因子間の相関を許容する方法である。これは間接的な回転法とされ、SPSSでのデフォルト設定として広く利用されている。 - direct oblimin は直接的な回転法で、因子間の相関の程度を delta 値で調整する。特に delta=0 の場合は direct quartimin と呼ばれ、最も一般的で解釈がしやすい斜交回転法とされている。
回転方法の選択指針
回転方法の選択は、事前の理論に基づいて行うべきである。 1. 因子が相関しないと仮定する場合: 直交回転を用いる。現在では、varimax が最も推奨される。 2. 因子が相関すると仮定する場合: 斜交回転を用いる。特に、direct quartimin(direct oblimin, delta=0) が最も推奨される。
推奨事項
直交回転よりも斜交回転が適している場合が多く、回転方法は因子の相関性に基づいて選択するべきである。また、使用する方法の長所と短所を理解し、結果が理論的に妥当かつ解釈可能であることを確認する必要がある。これにより、より信頼性の高いEFAの結果を得ることができる。
1.5. 因子負荷量カットオフ
因子負荷カットオフは、各変数がどの程度各因子を代表するかを評価する重要な基準である。一般的に、特定の因子を明確に代表する変数は保持され、複数の因子にまたがる変数やどの因子も代表しない変数は除去される(Hair et al., 2006; Hinkin, 1995, 1998; Tabachnick & Fidell, 2007)。
因子負荷カットオフに関する課題
因子負荷値を解釈する際、以下の2点が課題となる: 1. 変数が特定の因子を十分に代表していると判断できる基準は何か。 2. 変数が複数の因子に負荷しており、どの因子も明確に代表していないと判断する基準は何か。
因子負荷カットオフの提案
過去の研究では、以下のような「適切な負荷」と「過剰な負荷」に関するカットオフ値が提案されている: 1. 「適切な負荷」のカットオフ値 - 多くの研究で0.40が「良好な負荷」の基準とされている(Hinkin, 1995, 1998)。 - 他にも、0.30(Costello & Osborne, 2005)、0.32(Tabachnick & Fidell, 2001)、0.45(Tabachnick & Fidell, 2007)などの基準が提案されている。 2. 「過剰な負荷」のカットオフ値 - 他の因子への負荷が0.32または0.40を超える場合は過剰とされることが多い(Costello & Osborne, 2005)。 - また、主要因子と他の因子への負荷の差が0.20以上であるべきとする意見もある(Hinkin, 1998)。
推奨されるルール
本論文では、以下の「0.40–0.30–0.20ルール」を推奨している: 1. 主要因子への負荷が0.40以上であること。 2. 他の因子への負荷が0.30未満であること。 3. 主要因子と他の因子への負荷の差が0.20以上であること。
このルールに従うことで、変数が特定の因子を明確に代表しているか否かを判断しやすくなり、因子分析の結果をより解釈しやすくすることができる。
2. 現在の慣例
現在の実践状況
本研究では、サイバー心理学および人間とコンピュータの相互作用に関する研究で用いられている探索的因子分析(EFA)の現状を概観している。そのために、以下の7つの学術誌で「factor analysis」に言及しているすべての記事を検索し、それらのEFAに関する決定を記録した。
- Cyberpsychology, Behavior, and Social Networking
- Computers in Human Behaviors
- Journal of Educational Computing Research
- Journal of Computer-Mediated Communication
- New Media and Society
- International Journal of Human–Computer Interaction
- Computers & Education
検索の結果、220本の記事が発見され、そのうち163本がEFAを報告していた。なお、同じ記事内で複数のEFAが実施されている場合でも、特定の条件を除き、各記事の決定は1回のみ記録された。これは、複数のEFAを実施した記事が過剰に代表され、結果が偏るのを防ぐためである。
ただし、以下の2つの例外があった場合には複数回記録した: 1. 異なる決定が複数の因子分析で選択された場合、それぞれの決定を記録した。 2. 異なるサンプルを用いて同じ決定がなされた場合、決定は1回だけ記録し、それぞれのサンプルサイズを記録した。
これにより、EFAの使用状況とその方法論的決定の現状を公平に反映するデータが得られた。
2.1. データ検査技術
本研究では、探索的因子分析(EFA)におけるデータ検査技術の使用状況として、以下の情報を記録した:
- KMOサンプリング適合性指標(KMO Measure of Sampling Adequacy) の適用状況。
- Bartlettの球面性検定(Bartlett’s test of sphericity) の適用状況。
- 全体のサンプルサイズ。
当初は、参加者数と項目数の比率(Participant-to-item ratios)も記録する予定であったが、多くの研究で因子分析に含まれる変数数が明確に記載されていなかったため、この比率は記録されなかった。これにより、KMOとBartlett検定、およびサンプルサイズのみに焦点を当てた分析が行われた。
2.2. 因子分析法
選択された因子分析法を記録した。記録された選択肢は以下の通りである: - PCA(主成分分析) - PAF(主軸因子法) - ML(最尤法) - その他(other) - 未指定(unspecified)
2.3. 因子リテンション法
因子保持に用いられた方法を記録した。記録された選択肢は以下の通りである:
- Kaiser基準
- VSP分析(可視的スクリープロット分析)
- 並列分析(parallel analysis)
- VelicerのMAP検定
- 因子分散(factor variances)
- 代表的項目数(number of representative items)
- その他(other)
- 未指定(unspecified)
2.4. 因子回転法
因子回転法を記録した。以下の2つの観点で分類された:
回転タイプ
- 直交回転(orthogonal)
- 斜交回転(oblique)
- 未指定(unspecified)
具体的な回転法
- varimax
- quartimax
- equimax
- direct oblimin
- promax
- unrotated(回転なし)
- 未指定(unspecified)
これにより、因子分析で用いられる手法の多様性と実践状況を網羅的に記録した。
2.5. 因子負荷量カットオフ
因子負荷カットオフに関する情報を以下のように記録した:
主要因子の因子負荷カットオフ
- 著者が主要因子への因子負荷カットオフを明示しているかどうかを記録した。
- 明示されている場合、そのカットオフ値も記録した。
- 著者がカットオフ値を明示していない場合、すべての変数の中で主要因子に対する最小の因子負荷値を記録し、それを推定された因子負荷カットオフ(inferred factor loading cutoff)とみなした。
他の因子(交差負荷)のカットオフ
- 著者が交差負荷に関するカットオフ値を明示しているかどうかを記録した。
- 明示されている場合、そのカットオフ値を記録し、以下の区分で分類した:
- 単独の値としてのカットオフ(例:0.30以下)。
- 主要因子負荷との差としてのカットオフ(例:0.20以上の差がある場合に保持)。
推定値の記録
- 交差負荷に関するカットオフが明記されていない場合、推定値は記録しなかった。これは、多くの著者が交差負荷値を表に記載せず、ほとんどのカットオフ値を特定することができなかったためである。
これにより、因子負荷カットオフに関する記録は、明示された基準値と実際のデータから推測される基準値の双方を含む形となったが、交差負荷については限られた情報に基づくものとなった。
3. 結果
163本のEFAを含む論文の分析結果から、以下の傾向が見られた。特に2005年以降に発表された130本の論文に焦点を当てた結果を以下に示す。
3.1. データ検査技術とサンプルサイズ
- KMOサンプリング適合性指標(42%)と Bartlettの球面性検定(39%)の使用率はほぼ同程度であった。
- 両方を使用した論文は90%と高率だったが、いずれも使用しない論文が全体の56%を占めた。
- サンプルサイズの中央値は253、平均値は402であり、標準偏差568という大きなばらつきが見られた(最小値31、最大値5509)。
- 推奨される200名以上のサンプルサイズを満たさない論文は37%であった。
3.2. 因子分析法
- 最も多く使用された方法は PCA(53%) で、EFAとして推奨されない手法が主流となっていた。
- PAF(20%) と ML(12%) は次点であった。
- 因子分析法を明記しない論文も18%あり、多くは単に「因子分析を実施した」と記載していた。
3.3. 因子保持法
- Kaiser基準(54%)が最も多く使用され、次いで VSP分析(33%)と 並列分析(10%)が用いられていた。
- VelicerのMAP検定(4%)はまれに使用される程度だった。
- 因子保持法を明記しない論文は32%に達した。
- 方法を明記した論文の45%では複数の方法を併用しており、特にKaiser基準を使用した論文の42%がVSP分析や並列分析を併用していた。
3.4. 因子回転法
- 直交回転(58%)が主流で、特に varimax(92%)が支配的だった。
- 斜交回転(32%)では direct oblimin(50%)が最も多く、次いで promax(26%)が使用されていた。
- 回転方法を明記しない論文は15%であった。
3.5. 因子負荷カットオフ
- 主要因子の因子負荷カットオフを明記した論文では、平均値は0.44であり、推定可能な値を含めた平均値は0.48であった。
- 10%の論文でカットオフ値が0.30以下とされ、基準が十分でない可能性が見られた。
- 交差負荷に関してカットオフを明記した論文は22%のみで、その大半(73%)が特定の値(例:0.20)を採用していたが、距離に基づく基準は10%のみだった。
まとめ
本研究から、EFAの実施において基準や方法が明確にされていない場合が多く、特に因子分析法や因子保持法における適切性に課題が見られた。また、直交回転が主流である一方で、斜交回転の利用が増加傾向にある。さらに、因子負荷カットオフや交差負荷の基準については統一性が欠如しており、さらなる標準化が求められる。
4. 議論
サイバー心理学および人間とコンピュータの相互作用研究において、心理測定的に健全で妥当な尺度を作成することは極めて重要である。これらの分野では潜在構造の研究が主な関心となるが、分野の新しさゆえに確立された尺度が少ない。そのため、本論文では以下の2点を主眼としている: 1. 探索的因子分析(EFA)のプロセスにおける5つの重要な統計的および方法論的決定についてのレビューと提案。 2. EFAの現状の実践状況を概観し、適切な手法が用いられているかを検討。
これらを踏まえ、以下の重要な知見が得られた。
主な発見と提案
データ検査技術の利用不足
多くの研究で、KMO指標やBartlett検定といったEFAの前提条件違反を検査する手法が用いられていない(適用率42%および39%)。これらは変数間の相関が不十分でEFAが不適切な場合を特定するために有用であり、今後はこれらの技術を積極的に利用するべきである。サンプルサイズの不十分さ
平均サンプルサイズは402名であるものの、中央値は253名であり、推奨される200名を下回る論文が37%存在した。最小サンプルサイズが31名と極端に少ない例もあり、サンプル数が不足するとEFAの結果が著しく不正確になる可能性があるため、慎重な検討が必要である。不適切な因子分析法の選択
PCA(53%) が最も使用されていたが、これはEFAの形式ではなく統計的に問題がある。一方、PAF(20%) や ML(12%) は統計的に優れた方法であるにもかかわらず利用が少ない。また、因子分析法を明示しない研究も18%存在し、再現性や結果の妥当性が担保されない問題がある。Kaiser基準の過剰利用
因子保持法ではKaiser基準(54%)が最も多く使用されているが、この基準は因子数を過大評価する傾向があると指摘されている。代替として、VSP分析(33%) や 並列分析(10%)、VelicerのMAP検定(4%) の使用が推奨される。因子回転法の選択と記録の不備
直交回転(58%)が斜交回転(32%)よりも多く使用されていたが、回転法の理論的正当性が記載されていない場合が多い。回転法を不明確なまま使用するのは不適切であり、特に因子間の相関を許容する斜交回転(例:direct oblimin)を推奨する。因子負荷カットオフの適切性
主要因子負荷のカットオフは平均0.44で、推奨値に準じた値であったが、明示されていない研究が多い(46%)。また、交差負荷についてはほとんどの研究で考慮されておらず(78%)、交差負荷を適切に管理するルール(例:0.40–0.30–0.20ルール)の適用が求められる。近年の変化の乏しさ
過去10年間の研究において、EFAの基準や手法がほとんど改善されていない。コンピュータ技術や統計ソフトの進歩を考えると、これらの変化の乏しさは驚くべきことであり、これらの技術を積極的に活用することが望まれる。
結論と今後の提案
EFAの実施において、現在の基準や実践にはいくつかの系統的な問題が存在する。本論文では、これらを克服するためのベストプラクティスを提案しており、研究者がEFAを実施し報告する際に順守すべきチェックリストを提供している。このチェックリストに従うことで、EFAの質を向上させ、研究の妥当性を確保することが期待される。また、将来的には、より高度な手法の普及や報告の透明性向上に向けた取り組みが求められる。
5. 今後の研究への方向性
本研究では、今後の研究に向けて以下の2つの大きな提案を行っている。
1. 測定の重要性を強調する研究の継続
- 十分な測定基準を確保することの重要性を引き続き強調すべきである。特に、尺度作成と評価プロセスの他の側面(例:項目作成や確証的因子分析)に関する提案を提供する研究が必要である。
- また、尺度の他の属性、特に妥当性推論に関する現状を検討し、妥当性を確保する方法を調査することが有益である。その結果、既存の尺度の理論的基盤を強化する提案が可能となる。
2. 心理測定的に健全で妥当な尺度の必要性
- サイバー心理学や人間とコンピュータの相互作用研究では、心理測定的特性や妥当性が十分に調査されていない尺度に基づく研究結果が多く、結果が不正確になるリスクがある(Howard & Jayne, 2015)。
- 本研究で提案したベストプラクティスを適用することで、方法論的に健全な研究の新しい波を作り出し、研究の信頼性を向上させることが期待される。
具体的な研究分野への提案
1. 広く研究されている構成概念
本研究では以下の構成概念が特に多く研究されていると指摘している: - インターネット依存(Caplan, 2002; Pawlikowski et al., 2013) - サイバーブリング(Çetin et al., 2011; Lam & Li, 2013) - eラーニングの認識(Ozkan & Koseler, 2009; van Braak & Tearle, 2007) - 技術に対する態度(Korobili et al., 2010; Rainer & Miller, 1996)
これらの構成概念については、因子分析の選択が結果や解釈に大きな影響を与えており、次世代の研究では提案されたベストプラクティスを適用することで、次元性や概念化に関する議論を明確化することが求められる。
2. 研究が少ない構成概念
以下の構成概念については研究が少なく、今後の尺度作成の対象として再検討する価値がある: - コンピュータ自己効力感(Howard, 2014) - ブログの動機(Baker & Moore, 2011) - 技術関連の感情(Charlton & Birkett, 1995) - 非倫理的なコンピュータ行動(Namlu & Odabasi, 2007) - 臨場感(Presence)(Qin et al., 2009)
これらの構成概念の測定を改善することで、議論の明確化や新たな研究の発展が期待される。また、これらに限らず、研究が少ない構成概念についても新しい尺度を開発することは意義深い。新しい尺度の作成は、その分野での研究を促進し、新たな知見をもたらす可能性がある。
まとめ
今後の研究では、既存の構成概念の再検討とともに、新しい測定基準の開発を進めるべきである。これにより、サイバー心理学や人間とコンピュータの相互作用研究の信頼性と有効性が向上し、分野全体の発展に寄与するだろう。
6. 結論
本論文では、探索的因子分析(EFA)における5つの主要な決定事項を概観するとともに、サイバー心理学および人間とコンピュータの相互作用に関する7つの学術誌に掲載された論文のEFAの実践状況をレビューした。その結果、EFAに関する決定にはいくつかの系統的かつ問題のある懸念が存在することが明らかになった。
主な問題点
データ検査の不足
多くの著者がEFAの前提条件違反を確認せずに分析を行っている。不十分なサンプルサイズ
推奨されるカットオフ値を満たさないサンプルサイズが多く、分析の精度が懸念される。主成分分析(PCA)の過剰利用
PCAが最も多く使用されているが、EFAの真の形式ではなく、統計的な問題点が指摘されている。Kaiser基準の多用
因子保持法としてKaiser基準が主流であるが、因子数の過大評価につながる可能性がある。因子回転の正当性の記録不足
回転法に関する理論的正当性がほとんど記載されていない。変数の交差負荷の考慮不足
交差負荷に関する基準がほとんど考慮されておらず、観測結果の歪みにつながる恐れがある。
好ましい点
唯一一貫して良好であった点は、主要因子負荷のカットオフ値であり、多くの研究が妥当な基準を採用していた。
提言
これらの結果を踏まえ、以下の点が強く推奨される: - 本論文で提示されたEFAの決定に関する提案を慎重に検討し、適用すること。 - 将来の研究では、尺度作成と評価の他の側面に関するさらなる提案を行うこと。 - 心理測定的に健全で妥当な尺度の作成に注力すること。
EFAの質を向上させることは、サイバー心理学および人間とコンピュータの相互作用研究における信頼性と妥当性の向上につながり、分野全体の発展に寄与するだろう。