ギャンブル障害の推定値の話が参加している会議で出てきたので計算してみたいと思う。
圏内のギャンブル等依存に関する疫学調査(全国調査結果の中間とりまとめ) http://www.pref.hokkaido.lg.jp/hf/shf/seishin/gyannburukaigishiryou6-2.pdf
調査は2回行われているようだ。
1回目の調査。
平成25年度全国調査
研究実施主体:厚生労働科学研究研究代表者:樋口進(久里浜医療センター院長)
調査方法:自記式のアンケート調査
対象者の選択方法:全国の住民基本台帳より無作為に抽出
調査対象者数:7,052名
回答者数:4,153名(回答率58.9%)
ギャンブル等依存が疑われる者(生涯):4.8%(4.2~5.5%)
2回目の調査。
平成29年度全国調査
研究実施主体:日本医療研究開発機構(AMED)(久里浜医療センターに委託して実施。研究代表者:松下幸生副院長)
調査方法:面接調査
対象者の選択:方法全国の住民基本台帳より無作為に抽出
調査対象者数:10,000名
回答者数:4,685名(回答率46.9%)
ギャンブル等依存が疑われる者(1年):0.8%(0.5~1.1%)(32名/4,685名)
うちパチンコ・パチスロに最もお金を使った者(1年):0.7%(0.4~0.9%) (26名/4,685名)
ギャンブル等依存が疑われる者(生涯):3.6%(3.1~4.2%) (158名/4,685名)
うちパチンコ・パチスロに最もお金を使った者(生涯):2.9%(2.4~3.4%) (123名/4,685名)
1年有病率は0.8%、生涯有病率は4.8%(1回目)、3.6%(2回目)ということのようだ。
ただ、これはSOGS(The South Oaks Gambling Screen)を用いたスクリーニング調査で、実際にギャンブル障害である人ではなく、あくまでも「疑い」のある人の数である。
95%信頼区間の検算
library(prevalence) propCI(32, 4685, method = c("wald", "agresti.coull"), level = 0.95, sortby = "level") propCI(37.5, 4685, method = c("wald", "agresti.coull"), level = 0.95, sortby = "level") # 調整後の推測値
すべて値が違っている。資料をみると「数値は年齢調整後の値」と書いてあった。
報告書がないのでなんともわからないのだが、回答者の年齢の偏りを人口比に直して、計算したのではないかと推測される。
調整方法が違うとおかしなことになるかもしれないが、年齢調整値であれば逆算は可能なので推測値を出してみた。推測値で実際の値として少しずれている。報告書があればこのあたりはもう少し正確になるのだが、報告書が見当たらない。
やや不正確だが、下記の推測値で計算をしてみたい。端数が異なっている程度で大きく計算結果が異なることはないので、特に問題は生じないだろう。
実数 | 調整後の推測値 | 回答者 | 有病率 | 95%CL下限 | 95%CL上限 | |
---|---|---|---|---|---|---|
SOG一年 | 32 | 37.5 | 4685 | 0.800427 | 0.545269 | 1.055585 |
PPD一年 | 26 | 33.2 | 4685 | 0.708645 | 0.46845 | 0.9488392 |
SOG生涯 | 158 | 170 | 4685 | 3.628602 | 3.09313 | 4.164074 |
PPD生涯 | 123 | 138 | 4685 | 2.945571 | 2.461415 | 3.429727 |
SOG:一年:ギャンブル等依存が疑われる者(1年)
PPD一年:うちパチンコ・パチスロに最もお金を使った者(1年)
SOG生涯:ギャンブル等依存が疑われる者(生涯)
PPD生涯:うちパチンコ・パチスロに最もお金を使った者(生涯)
念のため、最初の出力だけ書いておこう。推定法は最も一般的なwald法を使っている。
x n p method level lower upper 1 32 4685 0.006830309 wald 0.95 0.004471867 0.009188752 1 37.5 4685 0.008004269 wald 0.95 0.005452690 0.01055585 # 調整後の推測値
SOGSの感度・特異度
日本語版のカットオフ値と感度・特異度は下記の論文で報告されている。
ちなみにカットオフは5だと厚労省の資料に書かれているので、感度1、特異度0.87ということになる。
参考までにアメリカでの感度・特異度をみてみよう。下記の論文で報告されている。
カットポイント5 | ||
---|---|---|
白人 | アフリカ系アメリカ人 | |
感度 | 1 | 0.94 |
特異度 | 0.19 | 0.08 |
カットポイント13 | ||
白人 | アフリカ系アメリカ人 | |
感度 | 0.64 | 0.61 |
特異度 | 0.71 | 0.56 |
アメリカの研究ではカットオフを5にした場合、感度は1だが、特異度が0.19(白人)、0.08(アフリカンアメリカン)となっていて日本の値と大きく異なっている。日本の調査対象者は一般の大学生で、アメリカはギャンブルを少なくとも週1回している人(ギャンブル障害の疑いの多いグループ)なので、特異度に大きな差が出てくるのはある意味当然ではある。
尺度研究は、ギャンブル障害と一致することも大事だが、ギャンブル障害と一致しないことも同じように重要であるため、一般人口や大学生といった極端にギャンブル障害が少ないサンプルでの検証はあまりよくない。ギャンブル障害とギャンブル障害ではない人がちょうど半分のサンプルが、最も検定力が高くなる。日本語版の326名中5名がカットオフ値5で該当というサンプル数だとサンプル数が全く足りていないのではないかと思われる。このようなサンプルで検証をすると、特異度が過度に高くなる。
アメリカの研究と日本の研究の特異度が全く異なるのはサンプルの性質によるものが大きいと考えられる。
ベイズ推定による有病率の推定
スクリーニングの結果+感度・特異度という数値が揃うと、ベイズ推定で真の有病率=診断できる人がどのくらいいるか、ということを推定できる。
ギャンブル依存(1年)
木戸ら(2019)日本人大学生を基にした感度・特異度による推定
prevalenceパッケージのtruePrev
関数で計算できるが、整数値でないと処理してくれないようなので37.5があたりの値がおそらく正しいのだが、37にしておこう。
library("prevalence") Prev <- truePrev(37, 4685, SE = 1, SP = 0.87, nchains = 4, burnin = 10000, update = 10000, verbose = FALSE) Prev
結果
mean median mode sd 2.5% 97.5% TP 0.00 0.00 0.00 0 0.00 0.001
結果は0.00(95%CL: 0.00-0.001)。小数点表示をもう少し細かくできればいいのだが、できないらしい。
95%信頼区間の上限が0.001なので、だいたい0.05%くらいなのではないかと思われる。
ただ、推定値が何か変なので密度プロットとトレースプロットを出してみた。
正常な推定ができていないことがわかる。後段で述べるように、このような推定結果になるのは、カットオフ値の問題である。
アメリカ白人の感度・特異度での推定
Prev2 <- truePrev(37, 4685, SE = 1, SP = 0.19, nchains = 4, burnin = 10000, update = 10000, verbose = FALSE) Prev2
結果。
mean median mode sd 2.5% 97.5% TP 0.00 0.00 0.00 0 0.00 0.001
こちらも似たようなものである。
アフリカン・アメリカンの感度・特異度での推定
Prev3 <- truePrev(37, 4685, SE = 0.94, SP = 0.08, nchains = 4, burnin = 10000, update = 10000, verbose = FALSE) Prev3
結果。
mean median mode sd 2.5% 97.5% TP 0.001 0.001 0.00 0.001 0.00 0.003
結果は0.1%(95%CL: 0.00-0.003)である。
小括
3つの感度・特異度のデータを用いて厚労省の調査結果の推定を行ったところ、どれも有病率が0.1%程度かそれ以下という推計値が得られた。
ギャンブル依存(生涯)
木戸ら(2019)の感度・特異度
library("prevalence") Prev4 <- truePrev(170, 4685, SE = 1, SP = 0.87, nchains = 4, burnin = 10000, update = 10000, verbose = FALSE) Prev4
mean median mode sd 2.5% 97.5% TP 0.00 0.00 0.00 0 0.00 0.001
結果は0.00(95%CL: 0.00-0.001)。
度数が増えているのに、推定値がほぼ同じである。
densplot(Prev4, exclude_fixed = TRUE) traceplot(Prev4, exclude_fixed = TRUE)
密度プロットとトレースプロット。
推定が上手くいっていないことが見て取れる。
なぜ推定がうまくいかないのか
理由は明白でカットオフ値を5にしているからである。 木戸ら(2019)ではカットオフ値が13だと感度は1、特異度は0.98である。陽性者もカットオフ値5の時と同じ5であった。 そこで、あくまでも仮想の計算として、厚労省の疫学研究の該当者が170名だったとして、感度1、特異度0.98で推定してみよう。
Prev5 <- truePrev(170, 4685, SE = 1, SP = 0.98, nchains = 4, burnin = 10000, update = 10000, verbose = FALSE) Prev5
結果。
mean median mode sd 2.5% 97.5% TP 0.014 0.014 0.014 0.003 0.009 0.02
結果は1.4%(95%CL: 0.9-2.0)であり、まともな値が出ている。
密度プロットとトレースプロットも出しておこう。
densplot(Prev5, exclude_fixed = TRUE) traceplot(Prev5, exclude_fixed = TRUE)
正常な推定が行われていることがわかる。
実際の数値が把握できないので、あくまでもシミュレーションにとどまるが、「疑い」として報告されているギャンブル障害の有病率よりも、「診断」が可能なギャンブル障害の有病率はかなり少ないと考えられる。
もちろん数が少ないから問題が無いのではなく、正しい数を把握して、その規模にあった対策を打つことが重要であり、過大に有病率を宣伝すべきではない、ということである。
正しく推定ができない原因は久里浜の研究に問題があるからである。
海外の尺度にカットオフ値が定められているからといって、それを日本でそのまま用いてはいけない。考えが足りないというか、尺度研究や疫学がよくわかっていない人がやりそうなことである。
木戸ら(2019)の研究では、カットオフ値13が適切ではないかと提案されており、実際にその数値で計算すると、正常な推定が可能になる。
科研で行われるような、二項分布を用いた通常の95%信頼区間の計算では、カットオフの妥当性が問題になることはないが、もう少しちゃんとした分析をしていくとカットオフ値を設定していないことが大きな問題点となってくる。
そもそも、感度・特異度を出さずに疫学調査をする、というのはかなり馬鹿げた考えであって、なぜこのようなことをしているのか、その後もインターネット依存、ゲーム障害でも同じ過ちを続けているのか、理解に苦しむ。
久里浜はまともな研究者のリクルートに失敗し続けていると言っていた人がいたが、実際にデータを分析をすると、その言葉の正しさを裏付けるような結果が出てくる。
久里浜はメディアや行政にアピールする力は強いものの、研究の質はどれを取っても三流という印象である。