井出草平の研究ノート

潜在クラス分析の適用例-禁煙

RMLCA(反復測定潜在クラス分析)の適用例として有名な論文らしい。

www.ncbi.nlm.nih.gov - Danielle E. McCarthy, Lemma Ebssa, Katie Witkiewitz, and Saul Shiffman, 2015, Paths to tobacco abstinence: A repeated measures latent class analysis, J Consult Clin Psychol. 83(4): 696–708.

使用されたパッケージ

All models were estimated using SAS version 9.3 (SAS Institute Inc., Cary, NC) via Proc LCA and in Mplus version 7.0 (Muthén & Muthén, 1998–2012) using maximum likelihood estimation with 200 random starts.

SAS Proc LCAとMplusが分析に使われている。SAS Proc LCAは使ったことがないでわからないが、この論文で行われている分析はMplusですべてできるはずである。

潜在クラス分析

f:id:iDES:20201205205551p:plain

最終的には5クラスが採用されている。

f:id:iDES:20201205205612p:plain

喫煙状況の27日分を用いて、1~7クラスのRMLCAモデルを検討した。モデル間のBIC/aBICモデル適合度とBLRTの違いから、クラスが増えるごとにモデル適合度の改善(BIC/aBICの低下に反映される)が5クラスモデルではスローになり始めたことが示された(表2参照)。モデル適合性の指標は6クラスと7クラスで改善したので、これらの解を詳細に調べた。これらのモデルに追加された1~2クラスは、小規模(有病率が5%以下)であり、日常的な喫煙状況のパターンが5クラスの解と非常に類似しており、共変量プロファイルと6ヵ月間の禁断率の点で5クラスの解のクラスと非常に類似していることがわかった。BIC/aBICの減少、解釈可能性、臨床的有用性に基づいて、我々は5クラスモデルを最終モデルとして選択した。

指標類ではクラスを増やし続けるとモデルはどんどん改善しているので、下記のようにクラス数が決定されている。

  1. モデル改善の指標の減少がスローになるポイントを探す。
  2. クラスが細分化されてよくわからなくなるポイントを探す。クラスの所属率なども参考。

このやり方はよい方針だと思った。

RMLCA

反復測定潜在クラス分析(RMLCA: repeated measures latent class analysis)。

一般化推定方程式(GEE)や混合効果ロジスティック回帰モデリング(Li, Wileyto, & Heitjan, 2011参照)などの日常喫煙をモデル化する他のアプローチでは、線形または二次傾向などの関数型に適合する。対照的に、RMLCAは、禁煙の初期に観察される可能性のある任意の複雑な喫煙パターン(例えば、ステップパターン)を捕捉し、識別することができる(Collins & Lanza, 2010)。さらに、RMLCAを用いることで、研究者は経時的に同様の変化パターンをたどると予想される(すなわち、潜在的なクラスメンバーシップを共有する)個人の小集団の大きさを推定することができ、潜在的なクラスメンバーシップを予測因子とDistal Outcomesの両方に関連付けることができる(Bray, Lanza, & Tan, in press; Collins & Lanza, 2010)。

図3の冒頭。

f:id:iDES:20201205205540p:plain

RMLCAの紹介
https://ctri.wisc.edu/researchers/behavior-change-analysis/rmlca/
RMLCAのMplusのコード
https://ctri.wisc.edu/researchers/behavior-change-analysis/sas-code/rmlca-mplus-code/
RMLCA vs. LTA
https://ctri.wisc.edu/researchers/behavior-change-analysis/rmlca-vs-lta/

RMLCA と LTA は、どちらも時間的なパターンを調べることができるが、その方法は異なる。RMLCAでは、複数回にわたる行動パターンに基づいて潜在クラスが定義される。これは、行動変容の試みの間に現れる共通のパターンを識別し、特徴づけるのに役立つ。LTAでは、(指標の複雑さにもよるが)各時点で複数の潜在クラスが出現することがあり、関心のある特定の遷移の推定値を得ることができる。 RMLCAは、LTAよりも多くの繰り返しが可能になりますが、特定の時点間の遷移についての特定の情報が少なくなる。
我々の作業では、RMLCAとLTAの両方を使用することにした。 我々は、比較的長い期間(27日)にわたる喫煙状態のパターンを特徴づけるためにRMLCAを使用し、禁煙試行の最初の週の週から週への主要な移行(例えば、禁欲への移行と禁欲からの脱却)を調べるためにLTAを使用している。 LTAで週ごとにデータを分析することは、RMLCAで出現した潜在クラスを調べることで示唆されたが、その結果から、禁煙試行中に喫煙確率の変化が1週目の終わりにいくつかのクラスで起こり、2週目の終わりに再び起こることが示唆された。

RMLCAというのを初めて聞いたが、反復データにはRMLCAが向いているようだ。確かにLTAではできない計算である。この研究では27日連続のデータを利用したようだが、社会科学でのタイムシリーズデータにも転用が効くように思う。例えば多国間比較のようなデータで転帰があるものが向いていそうな分析法である。

Distal Outcomes

断薬をDistal Outcomesとして設定して分析を行ったようだ。カテゴリカルなので、Lanza, Tan and Bray(2013)の方法をとったのだと思われる。MplusでいうDACT法である。

f:id:iDES:20201205205623p:plain

潜在的なクラス間の断薬率の限界平均を調べたところ(図2)、断薬率が最も高かったのは早期離脱者で、次いで後期間欠喫煙者、早期間欠喫煙者、そして禁煙失敗者と再発者の順となった。これらの禁断率のカイ二乗検定では、早期禁煙者の禁断率が他のすべての人よりも有意に高いことが示された(いずれも ps<0.0001)。禁煙失敗者は後期(p<0.001)または早期の間欠喫煙者(p=0.049)よりも断薬率が低かったが、再発者(p=0.929)では断薬率が低かった。再発者は後期(p<0.001)よりも断薬率が有意に低かったが、早期断続喫煙者(p=.116)ではなかった。さらに、後期間欠喫煙者は早期間欠喫煙者よりも断薬率が有意に高かった(p=0.007)。

  • Lanza S. T., Tan X., & Bray B. C. (2013). Latent Class Analysis With Distal Outcomes: A Flexible Model-Based Approach. Structural Equation Modeling, 20, 1-26.

要旨

5種類の禁煙薬物療法(ニコチンパッチ、ニコチンロゼンジ、ブプロピオンSR、パッチとロゼンジ、またはブプロピオンSRとロゼンジ)の二重盲検無作為化プラセボ対照臨床試験(N=1433)の二次解析において、禁煙試行後最初の27日間の毎日の喫煙状況(喫煙しているか否か)の反復測定潜在クラス分析を行った。潜在クラスメンバーシップと治療および共変量の関係が検討された。遠隔転帰分析では、潜在クラス間の6ヵ月間の確認された禁断率を比較した。 5クラスが選択された。喫煙者の4分の3は安定した喫煙または禁断のクラスにいたが、25%は経時的に禁断の確率が不安定なクラスにいた。積極的な治療(プラセボと比較して)、特にパッチとロゼンジの併用は早期の禁煙を促進した。潜在クラスは6ヵ月間の断薬率、ニコチン依存症、禁煙歴、自己効力感、睡眠障害、マイノリティの有無など、いくつかのベースライン変数で異なっていた。 反復測定潜在クラス分析により、治療の影響を受ける喫煙変化パターンの潜在クラスが同定され、既知の危険因子と関連しており、遠位転帰の予測因子となっている。