抹消結果を伴った潜在クラス分析(Latent Class Analysis with distal outcomes)とは、潜在変数を独立変数にした分析のことである。今回はMplusを使用して分析を行ってみたい。
まとめると以下のようになる。
表1 カテゴリカル変数の分析法のまとめ
観察された独立変数 | 潜在する独立変数 | |
---|---|---|
観察された従属変数 | ロジスティック回帰分析 | 共変量を伴った潜在クラス分析 |
潜在する独立変数 | 抹消結果を伴った潜在クラス分析 | カテゴリカルSEM |
潜在変数を独立変数にするのは難しい。未だに技法にの議論がされ続けており、方法論は今後もアップデートされる可能性がある。
ともあれ、現在推奨される方法に関してはコンセンサスがある。抹消結果の方が連続変数なのか、カテゴリカル変数なのかで手法が少し違う。
- 連続変数...BCH, DU3STEP
- カテゴリカル変数...DCAT
BCH
BolckとCroonとHagenaarsの論文で提唱された方法。おそらく、頭文字をとってBCHと呼ばれているのだと思われる。
- Bolck A., Croon M. & Hagenaars J., 2004, "Estimating Latent Structure Models with Categorical Variables: One-Step Versus Three-Step Estimators." Political Analysis 12:3–27.
- Bakk Z., & Vermunt J.K., 2014, "Robustness of stepwise latent class modeling with continuous distal outcomes. Forthcoming in Structural Equation Modeling," A Multidisciplinary Journal.
DCAT
ソフトウェア
実行できるソフトウェアはMplusとSASの2つである。
- Mplus...DCATはVer.7.1以上、BCHはVer.7.3以上が対応している。
- SAS...SASそのものに搭載されているのではなく、LanzaやDziakらが作成しているマクロを使う。
PROC LCA Macro https://methodology.psu.edu/downloads/proclcalta
LCA Distal Macro https://methodology.psu.edu/downloads/distal
このマクロはWindows版でしか作動しない。SASには無料版のSAS University Editionがあるが、Windowsの上にLinuxをエミュレートするものなので、University Editionではこのマクロは作動しない。
SASは年間ライセンス9万3000円(参照)である。永続的なライセンスは100万くらいするそうなので、年間ライセンスはお得だといえばお得であるが、それでも高価に感じる。
だいたいのことができるRだが、潜在変数関係に関して非常に弱く、共変量、抹消結果ともに扱えるパッケージがない。
データ
以前にに使用したデータ(参照)を使う。反社会的行為(ASB)に対して潜在クラス分析をして、その潜在クラスを独立変数として別の(顕在)変数との関連を調べるという例題である。
TITLE: LCA of ASB items with distal outcomes DATA: FILE = asb.dat; FORMAT = 34x 51f2; VARIABLE: NAMES = property fight shoplift lt50 gt50 force threat injure pot drug soldpot solddrug con auto bldg goods gambling dsm1-dsm22 male black hisp single divorce dropout college onset f1 f2 f3 age94; USEVARIABLES = property fight shoplift lt50 threat pot drug con goods single; CLASSES = c(4); CATEGORICAL = property-goods; Auxiliary = single(DCAT) ANALYSIS: TYPE = MIXTURE; ESTIMATOR = MLR; STARTS = 200 10; STITERATION = 50;
犯罪種別によって婚姻ステータスが変わるという仮説である。 実際のところは婚姻ステータスの方が独立変数かもしれないので、あくまでも例題であるという理解をしてもらいたい。 クラスと抹消結果との関連を見てみよう。
表2 クラス間の平均・蓋然性の均質性検定
Class | Odds Ratio | S.E. | 2.5%CI | 97.5%CI |
---|---|---|---|---|
class1 | 0.847 | 0.087 | 0.693 | 1.035 |
class2 | 1.538 | 0.140 | 1.288 | 1.838 |
class3 | 1.658 | 0.164 | 1.365 | 2.014 |
class4 | 1.000 | 0.000 | 1.000 | 1.000 |
クラス2とクラス3で独身者が多くなっている(5%水準)。
クラス間の差に検定も出力される。
表3 クラスの差の検定
Chi-Square | P-Value | |
---|---|---|
Overall test | 50.552 | 0.000 |
Class 1 vs. 2 | 27.692 | 0.000 |
Class 1 vs. 3 | 28.425 | 0.000 |
Class 1 vs. 4 | 2.746 | 0.098 |
Class 2 vs. 3 | 0.435 | 0.510 |
Class 2 vs. 4 | 21.616 | 0.000 |
Class 3 vs. 4 | 23.485 | 0.000 |
表1はオッズ比である。指標からしてどこかが参照カテゴリになっている必要がある。この表での参照カテゴリーはクラス4である。
他の補助(Auxiliary)コマンド
以前のこちらのエントリーを参照のこと。BCHを使うときには、コードのDCATとなっているところをBCHに書き換えればよい。
Appendix
参考までに指標の条件付き応答確率を掲載しておく。変数の説明が見つけられなかったので、右列の日本語は推測も交じっており、犯罪種別もすべて網羅しているわけではないので、解釈をするのは難しい。
表4 指標の条件付き応答確率
class1 | class2 | class3 | class4 | ||
---|---|---|---|---|---|
PROPERTY | 0.141 | 0.234 | 0.773 | 0.015 | 財産犯 |
FIGHT | 0.177 | 0.494 | 0.721 | 0.075 | けんか |
SHOPLIFT | 0.389 | 0.259 | 0.833 | 0.051 | 万引き |
LT50 | 0.236 | 0.172 | 0.688 | 0.037 | 50$以下の盗み |
THREAT | 0.358 | 0.640 | 0.797 | 0.066 | 脅迫 |
POT | 0.950 | 0.311 | 0.882 | 0.184 | マリファナ |
DRUG | 0.190 | 0.021 | 0.534 | 0.007 | ドラッグ |
CON | 0.190 | 0.335 | 0.629 | 0.060 | 詐欺 |
GOODS | 0.093 | 0.095 | 0.599 | 0.001 | 物品窃盗 |