井出草平の研究ノート

抹消結果(distal outcomes)を伴った潜在クラス分析

抹消結果を伴った潜在クラス分析(Latent Class Analysis with distal outcomes)とは、潜在変数を独立変数にした分析のことである。今回はMplusを使用して分析を行ってみたい。

f:id:iDES:20170921174454p:plain

まとめると以下のようになる。

表1 カテゴリカル変数の分析法のまとめ

観察された独立変数 潜在する独立変数
観察された従属変数 ロジスティック回帰分析 共変量を伴った潜在クラス分析
潜在する独立変数 抹消結果を伴った潜在クラス分析 カテゴリカルSEM

潜在変数を独立変数にするのは難しい。未だに技法にの議論がされ続けており、方法論は今後もアップデートされる可能性がある。

ともあれ、現在推奨される方法に関してはコンセンサスがある。抹消結果の方が連続変数なのか、カテゴリカル変数なのかで手法が少し違う。

  • 連続変数...BCH, DU3STEP
  • カテゴリカル変数...DCAT

BCH

BolckとCroonとHagenaarsの論文で提唱された方法。おそらく、頭文字をとってBCHと呼ばれているのだと思われる。

DCAT

ソフトウェア

実行できるソフトウェアはMplusとSASの2つである。

このマクロはWindows版でしか作動しない。SASには無料版のSAS University Editionがあるが、Windowsの上にLinuxをエミュレートするものなので、University Editionではこのマクロは作動しない。

SASは年間ライセンス9万3000円(参照)である。永続的なライセンスは100万くらいするそうなので、年間ライセンスはお得だといえばお得であるが、それでも高価に感じる。

だいたいのことができるRだが、潜在変数関係に関して非常に弱く、共変量、抹消結果ともに扱えるパッケージがない。

データ

以前にに使用したデータ(参照)を使う。反社会的行為(ASB)に対して潜在クラス分析をして、その潜在クラスを独立変数として別の(顕在)変数との関連を調べるという例題である。

TITLE:     LCA of ASB items with distal outcomes
DATA:      FILE = asb.dat;
           FORMAT = 34x 51f2;
VARIABLE:
           NAMES = property fight shoplift lt50 gt50 force
                   threat injure pot drug soldpot solddrug con auto
                   bldg goods gambling dsm1-dsm22 male black hisp
                   single divorce dropout college onset f1 f2 f3 age94;
           USEVARIABLES = property fight shoplift lt50 threat
                          pot drug con goods single;
           CLASSES = c(4);
           CATEGORICAL = property-goods;
           Auxiliary = single(DCAT)
ANALYSIS:  TYPE = MIXTURE;
                  ESTIMATOR = MLR;
                  STARTS = 200 10;
                  STITERATION = 50;

犯罪種別によって婚姻ステータスが変わるという仮説である。 実際のところは婚姻ステータスの方が独立変数かもしれないので、あくまでも例題であるという理解をしてもらいたい。 クラスと抹消結果との関連を見てみよう。

表2 クラス間の平均・蓋然性の均質性検定

Class Odds Ratio S.E. 2.5%CI 97.5%CI
class1 0.847 0.087 0.693 1.035
class2 1.538 0.140 1.288 1.838
class3 1.658 0.164 1.365 2.014
class4 1.000 0.000 1.000 1.000

クラス2とクラス3で独身者が多くなっている(5%水準)。
クラス間の差に検定も出力される。

表3 クラスの差の検定

Chi-Square P-Value
Overall test 50.552 0.000
Class 1 vs. 2 27.692 0.000
Class 1 vs. 3 28.425 0.000
Class 1 vs. 4 2.746 0.098
Class 2 vs. 3 0.435 0.510
Class 2 vs. 4 21.616 0.000
Class 3 vs. 4 23.485 0.000

表1はオッズ比である。指標からしてどこかが参照カテゴリになっている必要がある。この表での参照カテゴリーはクラス4である。

他の補助(Auxiliary)コマンド

以前のこちらのエントリーを参照のこと。BCHを使うときには、コードのDCATとなっているところをBCHに書き換えればよい。

Appendix

参考までに指標の条件付き応答確率を掲載しておく。変数の説明が見つけられなかったので、右列の日本語は推測も交じっており、犯罪種別もすべて網羅しているわけではないので、解釈をするのは難しい。

表4 指標の条件付き応答確率

class1 class2 class3 class4
PROPERTY 0.141 0.234 0.773 0.015 財産犯
FIGHT 0.177 0.494 0.721 0.075 けんか
SHOPLIFT 0.389 0.259 0.833 0.051 万引き
LT50 0.236 0.172 0.688 0.037 50$以下の盗み
THREAT 0.358 0.640 0.797 0.066 脅迫
POT 0.950 0.311 0.882 0.184 マリファナ
DRUG 0.190 0.021 0.534 0.007 ドラッグ
CON 0.190 0.335 0.629 0.060 詐欺
GOODS 0.093 0.095 0.599 0.001 物品窃盗