久里浜のゲーム障害16.2%論文で使われている構造化面接の問題点

久里浜の論文の解説はこちら。

ides.hatenablog.com

この論文で構造化面接が使われている。韓国のグループが作ったものだが、この構造化面接の正確性はどうなの？という話をしたので、少しまとめておきたい。

青年期におけるインターネットゲーム障害のための構造化臨床面接（SCI-IGD）

Koo, H. J., Han, D. H., Park, S.-Y., & Kwon, J.-H. (2017). The Structured Clinical Interview for DSM-5 Internet Gaming Disorder: Development and Validation for Diagnosing IGD in Adolescents. Psychiatry Investigation, 14(1), 21. https://doi.org/10.4306/pi.2017.14.1.21

目的本研究は、青年期におけるインターネットゲーム障害のための構造化臨床面接（SCI-IGD）の開発と検証を目的とした。方法まず、DSM-5の文献レビューや専門家の協議による情報をもとに、SCI-IGDの予備項目を作成した。次に、SCI-IGDの心理測定的特性を評価するために、地域社会と臨床現場の両方から合計236名の青年を募集した。結果第一に、SCI-IGDは約1ヶ月の期間で一貫していることがわかった。第2に、SCI-IGDと臨床医の診断的印象との間の診断的一致は良好であった。SCI-IGDの診断に対する正の尤度比推定値は10.93、負の尤度比推定値は0.35であり、SCI-IGDはIGDの存在を識別するために「非常に有用な検査」であり、IGDの不在を識別するために「有用な検査」であることを示した。第3に、SCI-IGDは障害のあるゲーマーとそうでないゲーマーを識別することができた。結論本研究の意味合いと限界についても述べた

有用な検査 useful testと結論付けられているが、本当にそうなのか、確かめてみたい。

各項目の感度・特異度など

Escapeの項目「8)否定的な気分（例：無力感，罪責感，不安）を避けるため，あるいは和らげるためにインターネットゲームを使用する．」は項目としてほとんど意味をなしていないことがわかる。

感度・特異度・陽性/陰性適中率・陽性/陰性尤度比

SCI-IGDと診断された12名のうち、8名（66.7%）がIGDのDSM-5に基づく精神科医の臨床面接でもIGDと診断された。 Among 12 diagnosed by SCI-IGD, eight (66.7%) were also diagnosed as IGD by the psychiatrist’s clinical interview based on the DSM-5 of IGD.

111人いて、12名がテストで陽性、8名が臨床診断で陽性であるため、いずれも陰性であったのは99名である。

111-8-4

分割表の作成。

dat1 <- as.table(matrix(c(8,4,0,99), nrow = 2, byrow = TRUE))
colnames(dat1) <- c("Dis+","Dis-")
rownames(dat1) <- c("Test+","Test-")
dat1

      Dis+ Dis-
Test+  8   4
Test-   0  99

計算

library(epiR)
rval1 <- epi.tests(dat1, conf.level = 0.95)
print(rval1)

Point estimates and 95% CIs:
--------------------------------------------------------------
Apparent prevalence *                  0.11 (0.06, 0.18)
True prevalence *                      0.07 (0.03, 0.14)
Sensitivity *                          1.00 (0.63, 1.00)
Specificity *                          0.96 (0.90, 0.99)
Positive predictive value *            0.67 (0.35, 0.90)
Negative predictive value *            1.00 (0.96, 1.00)
Positive likelihood ratio              25.75 (9.85, 67.30)
Negative likelihood ratio              0.00 (0.00, NaN)
False T+ proportion for true D- *      0.04 (0.01, 0.10)
False T- proportion for true D+ *      0.00 (0.00, 0.37)
False T+ proportion for T+ *           0.33 (0.10, 0.65)
False T- proportion for T- *           0.00 (0.00, 0.04)
Correctly classified proportion *      0.96 (0.91, 0.99)
--------------------------------------------------------------
* Exact CIs

Apparent prevalence　見かけ上の有病率
True prevalence　真の有病率
Sensitivity　感度
Specificity　特異度
Positive predictive value　陽性適中率
Negative predictive value　陰性適中率
Positive likelihood ratio　陽性尤度比
Negative likelihood ratio　陰性尤度比

尺度特性の問題点

構造化面接では12名陽性、8名が臨床診断で陽性ということは、構造化面接の方が1.5倍多く診断がされるということだ。また、臨床診断の方が正確で、構造化面接の不正確ということは、ツールとしての価値はないと言っているようなもので、大きな問題があろう。

とても「有用な検査 useful test」とはいえない。

また、仕方ない部分もあろうが、人数が少ないことから、感度も95%が0.63-1.00と幅が広く、信頼性が高いという結論は導くことはできない。

構造化面接作成の問題点

診断の正確性は臨床診断よりも構造化面接の方が高いとされている。
そのため、構造化面接と比較する基準は構造化面接よりも精度の高い方法を取るべきである。

一般的にLEAD基準(https://ides.hatenablog.com/entry/2021/10/24/142655)を用いる。
LEADを用いず臨床診断を基準にするのは手続き的な問題があると言えよう。