井出草平の研究ノート

Fornell & Larcker基準とHTMT基準の使い分け

iopscience.iop.org

  • M R Ab Hamid, W Sami and M H Mohmad Sidek, 2017, Discriminant Validity Assessment: Use of Fornell & Larcker criterion versus HTMT Criterion, Journal of Physics: Conference Series, Volume 890, 1st International Conference on Applied & Industrial Mathematics and Statistics 2017 (ICoAIMS 2017) 8–10 August 2017, Kuantan, Pahang, Malaysia.

概要

潜在変数を扱う研究では,多重共線性の問題を防ぐために,弁別的妥当性(discriminant validity)の評価が必須である。Fornell and Larcker基準は、この目的のために最も広く使用されている方法である。しかし heterotrait-monotrait (HTMT)の相関比法による弁別的妥当性評価を確立するための新しい方法が登場した。
FornellとLarckerの基準を用いて認めることができた。しかし、HTMT基準を採用した場合、弁別的妥当性が問題となった。これは、調査対象の潜在変数が多重共線性の問題に直面していることを示しており、さらに詳細を検討する必要がある。HTMT基準は潜在変数間の無差別性の可能性を検出できる厳格な尺度であることを示唆している。

弁別的妥当性の意義

研究者は事前に弁別的妥当性を確立する必要がある。これは、研究対象の因果関係を測定するために使用される潜在的な構成概念が、互いに真に異なるものであることを確認するためである。言い換えれば、それらは異なるものであり、多重共線性の問題を引き起こすような同じものを測定していないということである。この問題を解決せずに仮説モデルの検証を進めてしまうと、モデル全体の解釈が誤解を招いたり、役に立たなかったりする可能性がある。そのため、まず、差別的妥当性の評価を確立する必要がある。

以前、研究者は弁別的妥当性の評価に1981年に提案されたFornell and Larcker基準[2]を使用していた。しかし、最近では2015年にHenseler[1]がFornell and Larcker基準を否定しました。彼らは、従来の基準では、構成概念間の識別性を確立するにはまだ不十分であることを発見し、研究対象の構成概念間の識別性を捉えることができる、より強固なアプローチを提案した。

  • 1.Henseler J, Ringle CM, Sarstedt M 2015 J. Acad. Market. Sci.43 115-35
  • 2.Fornell C, Larcker DF 1981 J. Mark. Res.1 39-50

SmartPLS sofware version 2.0.M3を使用。PLS-SEMでは、reflective outer model の評価では、個々の項目の信頼性(指標の信頼性)、各潜在変数の信頼性、internal consistency 内的整合性(クロンバック・アルファCronbach alpha および複合信頼性composite reliability)、構成概念妥当性construct validity(loading and cross-loading)、収束的妥当性 convergent validity(抽出された平均分散(AVE))および弁別的妥当性(Fornell-Larcker基準、cross loading、HTMT基準)が検討される。

内的整合性

複合信頼性/クロンバック・アルファの値は、0.60から0.70の間で許容されるが、より高度な段階では、値は0.70より高くなければならない[7]。しかし,0.90以上は望ましくなく、0.95以上は確実に望ましくない[8]。

  • 7.Hair J, Hult GTM, Ringle C, Sarstedt M 2014 A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM) (Los Angeles: SAGE Publications, Incorporated)
  • 8.Nunnally JC, Bernstein IH 1994 Psychological theory (New York, NY: MacGraw-Hill)

指標の信頼性

指標の信頼性は、潜在変数によって説明される指標の分散の割合である。値の範囲は0から1である。outer loadingの値は0.70より高いことが望ましく,outer loadingが0.40から0.70である指標を削除することが,複合信頼性と抽出された平均分散(AVE)の増加に寄与する場合には,削除を考慮すべきである [7]。一方、outer loadingが0.40未満の指標は常に削除されるべきである[5],[9]。

  • Hulland J 1999 Strategic Management Journal 20 195–204.

収束的妥当性

収束的妥当性とは,同じ構成概念の複数の指標が一致している場合に,その相関性のレベルを測定するための評価である。収束的妥当性を確立するためには、指標の因子負荷、複合信頼性(CR)、平均抽出分散 average variance extracted(AVE)を考慮する必要がある[7]。この値は0から1の範囲である。AVEの値が0.50を超えれば、収束的妥当性が十分にあると言える[10],[11],[7],[2].

  • 10.Bagozzi R P, Yi Y 1988 J. Acad. Market. Sci. 16 74–94
  • 11.Henseler J, Ringle, Sinkovics RR 2009 J. Acad. Market. Sci. 20 227–319

弁別的妥当性

弁別的妥当性とは、経験的に構成が実際にどの程度異なっているかを指す。また、重複する構成間の差異の程度を測定する[7]。弁別的妥当性は、指標のcross-loading、Fornell & Larcker基準、Heterotrait-monotrait (HTMT) の相関比を用いて評価することができる。交差負荷 cross-loadingでは、因子負荷のカットオフ値が0.70以上であることを条件に、割り当てられた構成の因子負荷指標が他の構成のすべての負荷よりも高くなければならない[[5],[7]]。

第2の基準は,Fornell-Lacker基準を用いて弁別的妥当性を評価することである[12]. この方法は,抽出された平均分散 (AVE) の平方根潜在的な構成概念の相関を比較するものである [7].潜在的な構成概念は,他の潜在的な構成概念の分散ではなく,それ自身の指標の分散をよりよく説明する.したがって、各コンストラクトのAVEの平方根は、他の潜在的コンストラクトとの相関よりも大きな値を持つべきである[7]

  • 12.Fornell C, Cha J 1994 Advan. Meths. Market. Res. 407 52–78

弁別的妥当性を示すもう一つの指標は,Heterotrait-monotrait (HTMT) の相関比である。Henselerら[1]は,この方法の優れた性能をモンテカルロシミュレーション研究によって提案し,HTMTが交差荷重基準(0.00%)やFornell-Lacker(20.82%)と比較して,高い特異性と感度率(97%~99%)を達成できることを明らかにした。また、HTMTの値が1に近い場合は、弁別性が不足していると考えられる。HTMTを基準として使用するには、あらかじめ定義された閾値と比較する必要がある。HTMTの値がこのしきい値よりも高ければ、弁別的妥当性がないと結論づけることができる。いくつかの著者は、0.85の閾値を提案している[13]。また、Goldら[14]はこれに反論し、0.90の値を提案しています。

  • 13.Kline RB 2011 Principles and Practice of Structural Equation Modeling Third Edition (New York: The Guilford Press)
  • 14.Gold AH, Arvind Malhotra AH 2001 J. Manage. Inform. Syst. 18 185-214.

outer modelの評価

各項目の信頼性の評価は、交差負荷を確認することによって行われ、各項目の因子負荷の値は、それぞれの構成要素に対して高いことがわかった(各因子負荷はカットオフ値の0.70よりも大きい)。このことは,各項目の信頼性が高いことを示しており,各項目が指定された潜在的な構成概念に割り当てられていることを補強している。間接的には、収束的妥当性が支持されました。つまり、構成概念と項目の間に共有された分散があるということである [[16],[17]. 各因子の負荷は,有意水準5%で有意であった。

  • 16.Barclay D, Higgins C, Thompson R 1995 Technology Studies. 2 285-309
  • 17.Sang S L, Lee JD, Lee J 2010 E-government adoption in Cambodia: A partial least squares approach Transforming government: People, Process and Policy. 4 138-57

f:id:iDES:20210311013653p:plain

表1を参照すると、すべての構成要素のCRは0.70以上で、AVEの値は0.729から0.839の範囲内にある。弁別的妥当性は,Fornel and Larcker (1971) を用いて,対角線上の各AVEの平方根と,関連する行と列の各構成要素の相関係数(非対角線上)を比較することで評価する。「Productivity-Employee」構成と「Productivity-Stakeholder」構成については、ほとんど異論はない。しかし、その差はそれぞれ0.009、0.007とあまりにも小さく、無視することができる[18]。総合的に見て、この測定モデルには弁別的妥当性が認められ、構成間の弁別的妥当性を支持する。

  • 18.Rahim MA, Magner NR 1995 J. Appl. Psychol. 80 122-32

弁別的妥当性:Heterotrait-monotrait(HTMT)基準

以下の表2は、HTMT分析の出力を示したもの。

f:id:iDES:20210311013704p:plain

HTMTの結果から、表2の太字の値は、HTMT0.85の基準に照らして、弁別的妥当性に問題があることを示しています。これは、HTMT基準が潜在的な構成要素間の共線性の問題(多重共線性)を検出していることを意味している。culture-productivity, culture-employee, culture-stakeholder, productivity-employee, productivity-stakeholder, productivity-university performance (UP), employee-stakeholder and stakeholder-university performanceに問題があることがわかった。 おそらく、構成のほとんどの項目が同じことを測定しているのではなかと思われる。言い換えれば、影響を受ける構成における回答者の認識から、重複する項目が含まれているということである。