2値変数をアウトカムとしたプロビットモデルの媒介分析[Mplus]

こちらのTable 2.1の例を解説する。コードはリンク先のinpファイルを参照のこと。

www.statmodel.com

分析はMacKinnon et al.(2007)のもの。

モデル

f:id:iDES:20200913161530p:plain

データ

2 値の暴露変数tx、連続変数と仮定したの媒介変数intent(4値)、2値のアウトカム変数ciguseの3変数で構成されるモデルである。媒介変数intentはベースラインの約6ヵ月後に測定されたもので、次の2ヵ月間にタバコを使用するか否かという意思である。アウトカムciguseは、フォローアップで測定された前月にタバコを使用したか否かである。標本はn = 864人の学生であり、たばこの使用は標本の18%で観察された。

標本のオッズ比

データは下記の表である。

f:id:iDES:20200913161544p:plain

標本の総合効果は、媒介分析を行わなくても計算できる。これは、治療群の喫煙者の割合と対照群の喫煙者の割合の差である。 これにより、総合効果の推定値は確率の差である0.148-0.224 = -0.076となる。オッズ比は下記のように計算できる。

 TE(OR) =\frac{0.148/(1-0.148)}{0.221/(1-0.224)}=0.602

コード

Title: 
    Clinical Trials data
    from MacKinnon et al. (2007)

data:
    file = smoking.txt;
     
variable:
    names = intent tx ciguse;
    usev = tx ciguse intent;
    categorical = ciguse;

analysis:
        estimator = ml;
        link = probit;
        bootstrap = 10000;
       
model:      
        ciguse on intent tx;
        intent on tx;

model indirect: 
        ciguse IND intent tx;

output:
        tech1 tech8 sampstat cinterval(bootstrap);

plot:
        type = plot3;

コードの解説

variable: categorical = ciguse;

カテゴリカルに指定するのはアウトカムであるciguseだけである。暴露変数も2値であるが、独立変数側の設定は不要である。

analysis: link = probit;

linkオプションでプロビットを指定。

analysis: bootstrap = 10000;

ブートストラップを1000万回に指定。少し時間がかかる。たぶん1000でも問題ないと思う。

model indirect: ciguse IND intent tx;

tx → intent → ciguseのパスをmodel indirectオプションで指定。

output: cinterval(bootstrap)

ブートストラップでの信頼区間を表示させる。

結果

MODEL RESULTS

                                                    Two-Tailed
                    Estimate       S.E.  Est./S.E.    P-Value

 CIGUSE     ON
    INTENT             0.608      0.055     11.155      0.000
    TX                -0.203      0.111     -1.834      0.067

 INTENT     ON
    TX                -0.164      0.061     -2.681      0.007

 Intercepts
    INTENT             1.550      0.049     31.414      0.000

 Thresholds
    CIGUSE$1           1.798      0.123     14.640      0.000

 Residual Variances
    INTENT             0.776      0.055     14.190      0.000

TOTAL, TOTAL INDIRECT, SPECIFIC INDIRECT, AND DIRECT EFFECTS FOR LATENT RESPONSE VARIABLES


                                                    Two-Tailed
                    Estimate       S.E.  Est./S.E.    P-Value

Effects from TX to CIGUSE

  Indirect            -0.100      0.039     -2.596      0.009
  Direct effect       -0.203      0.111     -1.834      0.067

CONFIDENCE INTERVALS OF TOTAL, INDIRECT, AND DIRECT EFFECTS BASED ON COUNTERFACTUALS (CAUSALLY-DEFINED EFFECTS)


                  Lower .5%  Lower 2.5%    Lower 5%    Estimate    Upper 5%  Upper 2.5%   Upper .5%

Effects from TX to CIGUSE

  Tot natural IE    -0.046      -0.040      -0.036      -0.022      -0.008      -0.006      -0.001
  Pure natural DE   -0.121      -0.104      -0.095      -0.050      -0.005       0.004       0.020
  Total effect      -0.145      -0.128      -0.119      -0.072      -0.026      -0.017       0.000

 Odds ratios for binary Y

  Tot natural IE     0.724       0.757       0.772       0.853       0.939       0.958       0.991
  Pure natural DE    0.469       0.520       0.551       0.731       0.969       1.025       1.134
  Total effect       0.387       0.433       0.461       0.624       0.841       0.896       0.997