弁別的妥当性

WikipediaのDiscriminant validityの翻訳。

en.wikipedia.org

弁別的妥当性

心理学では、弁別的妥当性は、関連していると思われない概念や測定値が実際には関連していないかどうかをテストすることがある。

Campbell and Fiske (1959) は、検定妥当性の評価に関する議論の中で、弁別的妥当性の概念を導入した。彼らは、新しい試験を評価する際には、弁別的法と収束法の両方を用いることの重要性を強調した。弁別的妥当性の成功した評価は、概念のテストが理論的に異なる概念を測定するために設計された他のテストと高度に相関しないことを示した。

二つの尺度が相関しないことを示すには、測定誤差による相関の減衰を補正する必要がある。2つの尺度がどの程度重なっているかは、次の式を用いて計算することが可能であり、 r_{xy}は x と y の相関関係、 r_{xx}は x の信頼性、 r_{yy}は y の信頼性である。

\frac{r_{xy}}{\sqrt{{r_{xx}}*{r_{yy}}}}

弁別的妥当性の標準値はないが、 0.85未満の結果は、弁別的妥当性が2つの尺度の間に存在する可能性が高いことを示唆する。しかし、0.85を超える結果は、2つの構成概念が大きく重複しており、それらが同じものを測定している可能性が高いことを示唆しており、したがって、それらの間の識別的有効性は主張できない。

自己愛を測定する新しい尺度を開発している研究者を考えてみよう。自尊心を測定する尺度を用いて識別的妥当性を示したいと思うことがある。ナルシシズムと自尊心は理論的には異なる概念であるため、研究者らは彼らの新しい尺度が単なる自尊心ではなくナルシシズムを測定することを示すことが重要である。

最初に、2つの尺度内および尺度間の項目間の平均相関を計算することができる。

ナルシシズム - ナルシシズム: 0.47
ナルシシズム - 自尊心: 0.30
自尊心 - 自尊心: 0.52

減衰式の補正を適用できる。

 \frac{0.30}{\sqrt{0.47*0.52}}=0.607

0.607は0.85未満であるため、自己愛を測定する尺度と自尊心を測定する尺度との間に弁別的妥当性が存在すると結論できる。2つの尺度は理論的に異なる構成を測定する。

構成要素レベルでの弁別的妥当性をテストするために推奨されるアプローチは、AVE-SE比較(Fornell & Larcker, 1981; 注:ここでは、データから得られた生の相関ではなく、CFAモデルから得られた測定誤差調整済みの構成要素間相関を使用すべきである)[1] とHTMT比の評価(Henseler et al. [2] シミュレーションテストの結果、前者はPLSなどの分散ベースの構造方程式モデル(SEM)では性能が悪いが、Amosなどの共分散ベースのSEMでは性能が良く、後者は両方のタイプのSEMで性能が良いことが明らかになった[2][3]。Voorheesら(2015)は、共分散ベースのSEMではHTMTのカットオフを0.85とし、両方の手法を組み合わせることを推奨している[3]。

構成レベルでの弁別的妥当性を試験するための推奨アプローチは、 AVE‐SE比較(Fornell&Larcker、1981年;注:ここでは、データから導出された生の相関ではなく、CFAモデルから導出された測定誤差調整構成間相関を使用すべきである。) [1]とHTMT比の評価(Henselerら、2014年)である。シミュレーション試験は、前者がPLSのような変数に基づく構造方程式モデル (SEM) に対し良くないが、 Amosのような共変数に基づくSEMに対し良く、後者は両タイプのSEMに対し良い結果を示すことを明らかにした。[2] [3]。 Voorheesら (2015) は、0.85のHTMTカットオフで共変数に基づくSEMのための両方法を組み合わせることを推奨した[3] 。アイテムレベルでの弁別的妥当性を試験するための推奨アプローチは探索的因子分析 (EFA) である。

  1. Claes Fornell, David F. Larcker: Evaluating Structural Equation Models with Unobservable Variables and Measurement Error. In: Journal of Marketing Research. 18, February 1981, S. 39-50.
  2. Henseler, J., Ringle, C.M., Sarstedt, M., 2014. A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the Academy of Marketing Science 43 (1), 115–135.
  3. Voorhees, C.M., Brady, M.K., Calantone, R., Ramirez, E., 2015. Discriminant validity testing in marketing: an analysis, causes for concern, and proposed remedies. Journal of the Academy of Marketing Science 1–16.

  4. Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait-multimethod matrix. Psychological Bulletin, 56, 81-105.

  5. John, O. P., & Benet-Martinez, V. (2000). Measurement: Reliability, construct validation, and scale construction. In H. T. Reis & C. M. Judd (Eds.), Handbook of research methods in social psychology (pp. 339–369). New York: Cambridge University Press.