井出草平の研究ノート

「人間の集中力は8秒で金魚より短い」という説は正しいのか

なぜ「金魚」なのか。
答えは英語の慣用句にある。

「金魚の記憶」(memory of a goldfish)という言葉もあり 「非常に乏しい記憶力」という意味である。

ejje.weblio.jp

8秒説の前は3秒説だった

8秒説が唱えられる前は3秒説が唱えられていたことが判明している。

www.livescience.com

金魚が水槽をぐるぐると回っているのをイメージしたからではないかと推測されているが、決定づける証拠はない。もちろん3秒説にもエビデンスはない。

科学者たちの反論

Kalpathy Ramaiyer Subramanianが検証を行い、金魚の注意持続時間が8秒であることかせ誤りであることを指摘している。

www.ijtrd.com

また、実際には金魚は少なくとも5カ月は記憶があることが示唆されている。

economictimes.indiatimes.com

金魚は、一般に信じられているよりもはるかに知的なのだ。
神経心理学者は、金魚が良い記憶力を持っていることから、実際に記憶形成のモデルとして使用している。

www.warc.com

マイクロソフトの発表

ことの発端は2015年、カナダのマイクロソフトの研究チームの発表である。研究チームは「人間の平均的な注意持続時間は金魚より1秒遅れている」と報告した。

マイクロソフトの研究には平均9秒以下の注意力しか持たない金魚と比較して、人間の注意力がいかに「減少」しているか(12秒から8秒へ)を示すインフォグラフィックが提示されている。

マイクロソフトがこのような結果を示したのは、コンテンツをより短くコンパクトに誘導するためである。

ファクトチェックをしないメディア

マイクロソフトの報告をThe TelegraphからTIMEまで多くのメディアがファクトチェックをせずにニュースとして垂れ流したことから、金魚の話は広く知られることになった。

データの入手先

マイクロソフトが示した注意持続時間は独自に調査したものではなくStatistic Brainという研究機関から入手したものである。

www.statisticbrain.com

注意持続時間の統計。

www.statisticbrain.com

購読料を払えば内容をみることができるようだが、金魚の注意持続時間については書かれていないようだ。マイクロソフトマーケティングの際に盛り込んだもののようだ。

参考リンク

bettermarketing.pub

www.bbc.co.uk

監訳者・川島隆太さん「反抗期」を精神疾患にしてしまう-ダンクリー『子どものデジタル脳 完全回復プログラム』

日本語訳

研究から、メディアの消費量とそのような問題行動との間に関連性があるとわかっている。「反抗期障害」は、「精神障害の診断と統計マニュアル(DSM)」に掲載されている実際の診断名だが、現実には、それらの症状はほとんどの場合、ADHDやトラウマなどより具体的なものと関連している。(p.118)

日本語版を読んでいて思わず「そんな診断名ねーよ」と突っ込んでしまったが、前後の文脈で翻訳の問題であることは明らかだったので、原文を確認してみた。

原文

research suggests that there ’s a link between amount of media consumption and such disruptive behaviors. Although “oppositional-defiant disorder” is an actual diagnosis listed in the DSM, in practice these symptoms are virtually always related to something more specific, such as ADHD or trauma.(p.78)

証拠としてはDSM-5の日本語版(p.454)のスクリーンショットを掲載しておこう。

反抗挑発症、もしくは反抗挑戦性障害と翻訳するのが正しい。
些細なことだが、原文も間違っていて、oppositionalとdefiant間にハイフンは不要である。

もちろん「反抗期」とは全く関係はない。

「反抗期障害」なんてものをよく知らない人が読んだら、精神疾患は「反抗期」まで精神疾患にしているのか!(怒)となってしまうだろう。はたまた、反抗期はADHDやトラウマに関係しているととんでもない読み方をしてしまうかもしれない。

川島隆太さんの監訳、大丈夫なのだろうか。

『子どものデジタル脳 完全回復プログラム』の著者ビクトリア・ダンクリーは代替医療推進者である

プロフィール
https://drdunckley.com/wp-content/uploads/2011/10/Bio-V-Dunckley-MD2.pdf

ダンクリー博士は、ビタミンやハーブのサプリメント、微量栄養素の検査、バイオフィールド(身体の生体電気エネルギーフィールド)をサポートすることによって従来の治療法を補強している。ビデオゲームやその他の電子機器による脳の汚染を減らす「電子断食」(electronic fast)を利用し、気分、行動、認知、社会的スキルに急速な改善をもたらす4週間の「Save Your Child's Brain」プログラムで、何百人もの子供や若者を治療している。
ダンクリー博士は米国ホリスティック医学協会の会員である。

参考:
kotobank.jp

R二乗値は何の役にも立たない

カーネギーメロン大学のCosma Shalizi氏による資料から。

https://www.stat.cmu.edu/~cshalizi/

こちらの3節の翻訳である。
https://www.stat.cmu.edu/~cshalizi/mreg/15/lectures/10/lecture-10.pdf


3. R二乗

R二乗は線形モデルを最小二乗法で推定する場合、適合した値の標本分散とYの標本分散の比で求められる。

 (5)

あるいはYの標本共分散と適合した値の比率である。

 (6)

これらが等しいことを示す。重要なのは1)  y_i = \hat{m}(x_i) + e_{i}、2) e_{i} \hat{m}(x_i) の標本共分散がちょうどゼロであることである。

最小二乗法で推定された線形モデルについては、式5と式6が常に同じ結果を与えることがわかる。

 s^2_\hat{m}とはなんだろうか。  \hat{m}(x_i) = \hat\beta_0 + \hat{\beta}_1 x_1であるから。

こうしてR二乗の3番目の式が得られる。

(7)

ここから、さらに4つ目の式が導かれる。

(8)

XとYの相関係数の二乗であることがわかる(したがってR二乗と呼ばれる)。この式の特筆すべき点は、YをXに回帰させても、XをYに回帰させても、全く同じR二乗が得られることである。 R二乗の最終式は次のようになる。

(9)

 \hat{\sigma}^2は残差の標本分散であり、残差は \hat{m}相関がないので、分子が s^2_\hat{m}に等しいことを示すのは難しくない。

調整済みR二乗

 \hat{\sigma}^2 \sigma^2の推定値としてわずかに負のバイアスを持つことは良く知られている。そのため、 \hat{\sigma}^2の代わりに、 \sigma^2 のバイアスのない推定値として \frac{n}{n-2} \hat{\sigma}^2を用いた調整済みR二乗を見ることがある。

R二乗のリミット

式7より、 \hat{\beta}_1 = 0 のときR二乗は0になる。一方、すべての残差が0であれば、 s^2_Y= \hat{\beta} \frac{1}{2} s^2_xとなり、R二乗は1となる。とはならない。R二乗が1より大きくなることはありえないことを示すのはそれほど難しいことではないので、その限界を示した。標本の傾きが0であればR二乗は0となり、可能な限り小さくなり、すべてのデータ点が正確に直線上にあれば、R二乗は1となり、可能な限り大きくなる。

3.1理論的R二乗

本当の係数がわかったとする。R二乗はどうなるのだろうか?
式(5)を使うと、次のようになる。

すべてのパラメータ推定値が一致し、この式はすべてのパラメータで連続なので、我々の推定値から得られるR二乗はこの極限に収束する。線形モデルが全く間違っていたとしても、 \beta_1の推定値は Cov\lbrack X,Y \rbrack  / Var \lbrack X \rbrackに収束する。したがって、単純な線形モデルが適用されようがされまいが、 \beta_1を適切に解釈すれば、理論的R二乗は式13で与えられる。

3.2 邪魔か迷惑か?

残念ながら、R二乗に関する多くの神話が科学界に蔓延しており、この時点でそれらに対する免疫をつけることが肝要である。

  1. 最も基本的なことは、R二乗は適合度を測定するものではないということである。 a) モデルが完全に正しい場合、R二乗は恣意的に低くなることがある。 式(13)を見てほしい。 Var \lbrack X \rbrackを小さく、または \sigma^2を大きくすることで、単純な線形回帰モデルの仮定がすべて正しくても、R二乗が0に近づいてしまう。たとえ単純な線形回帰モデルのすべての仮定があらゆる点で正しくても。

b) R二乗はモデルが全く間違っている場合、任意に1に近づけることができる。例えば、本文中2節のシミュレーションに適用した線形モデルのR二乗は0.745である。真のモデルが非線形であるとき、R二乗がどれだけ高くなるかは、実に無限大である。必要なのは、最良の線形近似の傾きがゼロでないことと、 Var \lbrack X \rbrackが大きくなることである。

  1. R二乗は予測可能性を示す指標としてはかなり役に立たない。 a) R二乗は予測誤差について何も触れていない。式13に戻り、架空のケースを考えてみよう。 \sigma^2が全く同じで、係数に変化がない場合でも、Xの範囲を変えるだけでR二乗は0から1の間のどこにでもなる。平均二乗誤差は、予測値の良し悪しを測るのにもっと適した尺度である。さらに良いのは、このコースの後半で取り上げる標本外誤差の推定値である。

b) R二乗は区間予測について何も触れていない。特に、予測区間やm(x)の信頼区間がどの程度になるかについては、何も教えてくれない。

  1. R二乗は異なるデータセット間で比較することはできない。もう一度式(13)を見て全く同じモデルが異なるデータで全く異なるR二乗値を持つことがあることを確認してほしい。

  2. R二乗は,未変換Yを使ったモデルと変換したYを使ったモデルの間,あるいはYの異なる変換の間で比較することはできない。より正確には,自由な国なので,誰もそれを止めはしないが、無意味である。具体的には、モデルの仮定がよりよく満たされるとR二乗は簡単に下がる、など。

  3. R二乗が比較できる1つの状況は、同じ変換されていない応答変数で、異なるモデルが同じデータセットに適合するときである。その場合、二乗の増加は、サンプル内MSE(Mean Squared Error, 平均二乗誤差)の減少と同じである(式9による)。しかし、その場合は、MSEを比較するだけでもよいかもしれない。

  4. R二乗は回帰によって「説明される分散の割合」であるという理解が非常に一般的である。これはR二乗を「決定係数」と呼ぶことことに付随するる。これらの用法は、式9から生じたものに過ぎず、推奨および根拠なるものは何もない。式8は、XをYに回帰させた場合、全く同じR二乗が得られることを示している。このこと自体、高いR二乗が、ある変数を別の変数で説明することについて何も語っていないことを示すのに十分であろう。また、どちらかが他方を説明することができないにもかかわらず、R二乗が高いという状況を作り出すことは非常に簡単である(6)。R二乗の観点から「説明する」という動詞を再定義しない限り、R二乗と科学的説明と呼ばれるものの間には何の関連もない(7)。

R二乗の代わりに調整済みR二乗を使用しても、このような問題は全く解決されない。

この時点で、R二乗が何の役に立つのか、他のツールではできないどんな仕事をするのか、疑問に思われるかもしれない。私が言える唯一の正直な答えは、R二乗が全く役に立たなかったという状況を見つけたことがないということある。もし私が回帰分析のカリキュラムをゼロから設計することができたなら、R二乗について言及することはないでしょう。残念ながら、それは歴史的遺物として生き続けているので、あなたはそれが何であるか、そして人々がそれについてどんな誤解に苦しんでいるかを知っておく必要がある。


(6) 例えば、シカゴでの死者数を、毎日Tシャツを着ているシカゴ市民の数で回帰させたとする。さらに言えば、Tシャツを着ているシカゴ市民の数を死亡者数に回帰させることを想像してほしい。説明として推奨されることがさらに少ない何千もの例については、http://www.tylervigen.com/spurious-correlations を参照。
(7) 研究者の中には(Weisburd and Piquero 2008; Low-D´ecarie et al. 2014など)は、生態学や犯罪に関する科学論文で報告されたR二乗の値をすべて集め、生態学者や犯罪学者が研究対象の現象の説明力を高めたかどうかを確認しようと試みている。なぜこのような演習が無意味なのか、おわかりいただけたであろう。

Reddit

このことが議論されたReddit

www.reddit.com

performanceパッケージ[R]

easystats.github.io

CRAN: https://cran.r-project.org/web/packages/performance/index.html rdrr.io: https://rdrr.io/cran/performance/

YouTubeでの解説(英語)

www.youtube.com

コードの使用法

https://rdrr.io/cran/performance/f/README.md

回帰モデルを構築するパッケージモデルの品質と適合度の指標を計算するためにR2(二乗)、RMSE(二乗平均平方根誤差)、クラス内相関係数ICC)などの指標や(混合)モデルの過分散、ゼロインフレ、収束、特異性などをチェックする関数が含まれている。

library(performance)

線形回帰 R二乗

model <- lm(mpg ~ wt + cyl, data = mtcars)
r2(model)
Show in New Window
# R2 for Linear Regression
       R2: 0.830
  adj. R2: 0.819

二項ロジット 疑似決定係数

model <- glm(am ~ wt + cyl, data = mtcars, family = binomial)
r2(model)

Tjurの読み方はおそらくテュアー。

# R2 for Logistic Regression
  Tjur's R2: 0.705

文献はこちら。
https://www.tandfonline.com/doi/abs/10.1198/tast.2009.08210

  • Tjur, T. (2009). Coefficients of determination in logistic regression models - A new proposal: The coefficient of discrimination. The American Statistician, 63(4), 366-372.

R二乗がどのくらい必要なのかは疑問だが、NagelkerkeのR2やCox. & shellのR2よりはよいかもしれない。McFadden'sやEfron's R2もある。

順序ロジット 疑似決定係数

library(MASS)
data(housing)
model <- polr(Sat ~ Infl + Type + Cont, weights = Freq, data = housing)
r2(model)

結果。

 Nagelkerke's R2: 0.108

また、r2_bayes()、r2_coxsnell()、r2_nagelkerke()などの関数により、指定したいR2乗を直接算出できる。

混合モデルの場合、条件付きR2乗とマージナルR2乗が返される。マージナルR2乗は、固定効果の分散のみを考慮し、モデルの分散が固定効果部分のみによってどれだけ説明されるかを示すものである。条件付きR2乗は、固定効果とランダム効果の両方を考慮し、モデルの分散のどれくらいが「完全な」モデルによって説明されるかを示す。

frequentistの混合モデルでは、r2() (resp. r2_nakagawa()) は平均ランダム効果分散を計算するので、r2()はランダムスロープや入れ子ランダム効果など、より複雑なランダム効果構造を持つ混合モデルにも適している (Johnson 2014; Nakagawa, Johnson, and Schielzeth 2017)。

ベイズ

set.seed(123)
library(rstanarm)

model <- stan_glmer(Petal.Length ~ Petal.Width + (1 | Species), data = iris, cores = 4)

r2(model)

結果。

# Bayesian R2 with Compatibility Interval

  Conditional R2: 0.953 (95% CI [0.940, 0.963])
     Marginal R2: 0.824 (95% CI [0.725, 0.898])

線形混合モデル

library(lme4)
model <- lmer(Reaction ~ Days + (1 + Days | Subject), data = sleepstudy)
r2(model)

結果。

# R2 for Mixed Models

  Conditional R2: 0.799
     Marginal R2: 0.279

級内相関係数(ICC)

R二乗と同様に、ICCは説明される分散に関する情報を提供し、「母集団におけるグループ化構造によって説明される分散の割合」として解釈することができる(Hox 2010)。

icc() は、'stanreg'モデルを含む様々な混合モデルオブジェクトの ICC を計算する。

library(lme4)
model <- lmer(Reaction ~ Days + (1 + Days | Subject), data = sleepstudy)
icc(model)

結果。

# Intraclass Correlation Coefficient

     Adjusted ICC: 0.722
  Conditional ICC: 0.521

brmsfitクラスのモデルは、、、

library(brms)
set.seed(123)
model <- brm(mpg ~ wt + (1 | cyl) + (1 + wt | gear), data = mtcars)
icc(model)
# Intraclass Correlation Coefficient
      Adjusted ICC: 0.930
      Conditional ICC: 0.771

モデル診断

過大分散のチェック。 過大分散は、観測されたデータの分散が、モデルの仮定から期待される分散(ポアソンの場合、分散は結果の平均にほぼ等しい)よりも大きい場合に発生する。 check_overdispersion() は、カウントモデル(混合モデルを含む)が過大分散であるかどうかをチェックする。

library(glmmTMB)
data(Salamanders)
model <- glm(count ~ spp + mined, family = poisson, data = Salamanders)
check_overdispersion(model)

結果。

# Overdispersion test

       dispersion ratio =    2.946
  Pearson's Chi-Squared = 1873.710
                p-value =  < 0.001

Overdispersion detected.

過剰分散は,分散パラメータをモデル化するか(すべてのパッケージで可能ではない),別の分布族を選択することで修正できる(準ポアソンや負の二項分布など, (Gelman and Hill 2007)を参照).

ゼロインフレのチェック

ゼロインフレは(準)ポアソンモデルにおいて、観測されたゼロの量が予測されたゼロの量より多い場合に示され、そのためモデルはゼロをアンダーフィットしていることになる。このような場合、負の二項モデルまたはゼロインフレートモデルを使用することが推奨される。

適合したモデルにゼロインフレートがあるかどうかを調べるには check_zeroinflation() を使用する。

model <- glm(count ~ spp + mined, family = poisson, data = Salamanders)
check_zeroinflation(model)

結果。

# Check for zero-inflation

   Observed zeros: 387
  Predicted zeros: 298
            Ratio: 0.77

特異なモデル適合をチェックする

特異なモデル適合とは、分散共分散行列のいくつかの次元が正確にゼロとして推定されていることを意味する。これは過度に複雑なランダム効果構造を持つ混合モデルでよく発生する。

check_singularity() は、混合モデル(lme, merMod, glmmTMB または MixMod クラス)の特異性をチェックし、モデルの適合が特異である場合に TRUE を返す。

# library
library(lme4)
data(sleepstudy)

# prepare data
set.seed(123)
sleepstudy$mygrp <- sample(1:5, size = 180, replace = TRUE)
sleepstudy$mysubgrp <- NA
for (i in 1:5) {
    filter_group <- sleepstudy$mygrp == i
    sleepstudy$mysubgrp[filter_group] <- sample(1:30, size = sum(filter_group), replace = TRUE)
}
# fit strange model
model <- lmer(Reaction ~ Days + (1 | mygrp/mysubgrp) + (1 | Subject), data = sleepstudy)

check_singularity(model)

結果。

boundary (singular) fit: see ?isSingular
[1] TRUE

シンギュラーフィットの問題を解決するための解決法は、こちら。 https://easystats.github.io/performance/reference/check_singularity.html

異種分散性のチェック

線形モデルは、一定の誤差分散(homoskedasticity)を仮定している。check_heteroscedasticity()関数は、この仮定が破られているかどうかを評価する。

data(cars)
model <- lm(dist ~ speed, data = cars)

check_heteroscedasticity(model)

結果。

Warning: Heteroscedasticity (non-constant error variance) detected (p = 0.031).

モデルチェックの包括的な可視化

performanceには、check_collinearity()、check_normality()、check_heteroscedasticity()など、モデルの仮定をチェックする関数が多数用意されている。包括的なチェックを行うには、 check_model() を使用する。

# defining a model
model <- lm(mpg ~ wt + am + gear + vs * cyl, data = mtcars)

# checking model assumptions
check_model(model)

モデル性能の要約

model_performance() は、回帰モデルのモデル性能の指標を計算する。モデルオブジェクトに依存するが、典型的な指標は r-2乗、AICBIC、RMSE、ICC または LOOIC であろう。

線形回帰

m1 <- lm(mpg ~ wt + cyl, data = mtcars)
model_performance(m1)

結果。

# Indices of model performance

AIC     |     BIC |    R2 | R2 (adj.) |  RMSE | Sigma
-----------------------------------------------------
156.010 | 161.873 | 0.830 |     0.819 | 2.444 | 2.568

ロジスティック回帰

m2 <- glm(vs ~ wt + mpg, data = mtcars, family = "binomial")
model_performance(m2)

結果。

# Indices of model performance

AIC    |    BIC | Tjur's R2 |  RMSE | Sigma | Log_loss | Score_log | Score_spherical |   PCP
--------------------------------------------------------------------------------------------
31.298 | 35.695 |     0.478 | 0.359 | 0.934 |    0.395 |   -14.903 |           0.095 | 0.743

線形混合モデル

library(lme4)
m3 <- lmer(Reaction ~ Days + (1 + Days | Subject), data = sleepstudy)
model_performance(m3)

結果。

# Indices of model performance

AIC      |     AICc |      BIC | R2 (cond.) | R2 (marg.) |   ICC |   RMSE |  Sigma
----------------------------------------------------------------------------------
1755.628 | 1756.114 | 1774.786 |      0.799 |      0.279 | 0.722 | 23.438 | 25.592

モデル比較

compare_performance()関数は、複数のモデル(異なるタイプのモデルを含む)の性能と品質を比較するために使用することができる。

counts <- c(18, 17, 15, 20, 10, 20, 25, 13, 12)
outcome <- gl(3, 1, 9)
treatment <- gl(3, 3)
m4 <- glm(counts ~ outcome + treatment, family = poisson())
compare_performance(m1, m2, m3, m4)

結果。

Name |   Model |      AIC | AIC weights |      BIC | BIC weights |   RMSE |  Sigma | Score_log | Score_spherical |    R2 | R2 (adj.) | Tjur's R2 | Log_loss |   PCP |     AICc | AICc weights | R2 (cond.) | R2 (marg.) |   ICC | Nagelkerke's R2
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
m1   |      lm |  156.010 |     < 0.001 |  161.873 |     < 0.001 |  2.444 |  2.568 |           |                 | 0.830 |     0.819 |           |          |       |          |              |            |            |       |                
m2   |     glm |   31.298 |       1.000 |   35.695 |       1.000 |  0.359 |  0.934 |   -14.903 |           0.095 |       |           |     0.478 |    0.395 | 0.743 |          |              |            |            |       |                
m3   | lmerMod | 1763.986 |     < 0.001 | 1783.144 |     < 0.001 | 23.438 | 25.592 |           |                 |       |           |           |          |       | 1764.471 |              |      0.799 |      0.279 | 0.722 |                
m4   |     glm |   56.761 |     < 0.001 |   57.747 |     < 0.001 |  3.043 |  1.132 |    -2.598 |           0.324 |       |           |           |          |       |          |              |            |            |       |           0.657

モデル性能の一般的な指標

また、モデルの性能を表す合成指標を簡単に計算し、最適なモデルから悪いモデルへと並べ替えることもできる。

compare_performance(m1, m2, m3, m4, rank = TRUE)

結果。

# Comparison of Model Performance Indices

Name |   Model |   RMSE |  Sigma | AIC weights | BIC weights | Performance-Score
--------------------------------------------------------------------------------
m2   |     glm |  0.359 |  0.934 |       1.000 |       1.000 |           100.00%
m4   |     glm |  3.043 |  1.132 |     < 0.001 |     < 0.001 |            46.89%
m1   |      lm |  2.444 |  2.568 |     < 0.001 |     < 0.001 |            46.09%
m3   | lmerMod | 23.438 | 25.592 |     < 0.001 |     < 0.001 |             0.00%

モデル性能の指標の視覚化

最後に可視化機能を提供する。

plot(compare_performance(m1, m2, m4, rank = TRUE))

テストモデル

test_performance() (およびそのベイズ版である test_bf) は、入力に基づき、最も関連性が高く適切なテストを実行する。(たとえば、モデルがネストされているかどうかなど)。

データ。

set.seed(123)
data(iris)

lm1 <- lm(Sepal.Length ~ Species, data = iris)
lm2 <- lm(Sepal.Length ~ Species + Petal.Length, data = iris)
lm3 <- lm(Sepal.Length ~ Species * Sepal.Width, data = iris)
lm4 <- lm(Sepal.Length ~ Species * Sepal.Width + Petal.Length + Petal.Width, data = iris)
test_performance(lm1, lm2, lm3, lm4)

結果。

 Name | Model |     BF | Omega2 | p (Omega2) |    LR | p (LR)
 ------------------------------------------------------------
 lm1  |    lm |        |        |            |       |       
 lm2  |    lm | > 1000 |   0.69 |     < .001 | -6.25 | < .001
 lm3  |    lm | > 1000 |   0.36 |     < .001 | -3.44 | < .001
 lm4  |    lm | > 1000 |   0.73 |     < .001 | -7.77 | < .001
test_bf(lm1, lm2, lm3, lm4)

結果。

Bayes Factors for Model Comparison

      Model                                                    BF
[lm2] Species + Petal.Length                             3.45e+26
[lm3] Species * Sepal.Width                              4.69e+07
[lm4] Species * Sepal.Width + Petal.Length + Petal.Width 7.58e+29

* Against Denominator: [lm1] Species
*   Bayes Factor Type: BIC approximation

DASS: The Depression Anxiety Stress Scalesの日本語版の状況

DASS: The Depression Anxiety Stress Scalesについて調べてみた。

オリジナルはこちら

pubmed.ncbi.nlm.nih.gov

オリジナルは42項目である。

DASS-21

DASS-21は21項目の短縮版である。オリジナルの論文Lovibond and Lovibond(1995)の中ですでに作られている。

日本語版

DASS フルバージョン
www2.psy.unsw.edu.au

DASS-21
http://junhara.net/nodasemi/dass21.pdf

DASS 日本語版の妥当性の検討

この2つの学会発表で妥当性の検討が行われているらしい。

jglobal.jst.go.jp

jglobal.jst.go.jp

この2つの学会発表要旨はCiNii、 JGLOBAL、学会のウェブサイトにもなく、国会図書館にも納品されておらず、確認がされない状態にある。

ndlonline.ndl.go.jp

別のグループの研究

jglobal.jst.go.jp

https://www.jschild.med-all.net/Contents/private/cx3child/2017/0076s1/252/0229-0229.pdf

そのパイロット調査ではDepression Anxiety Stress Scalesを使用した。その尺度の日本語訳版は尺度を開発した研究者グループによってウエブ上に提供されてはいるが、その信頼性と妥当性は検証されていない。そこで、この尺度を中学生に適応した場合の内的性整合性と構成概念妥当性について検討したので報告する。

内的性整合性と構成概念妥当性は確認されていないようだ。

【結論】
Depression Anxiety Stress Scalesの日本語版を中学生に用いる場合には、ウエブ上に掲載されている質問項目を修正して使用する必要があることが明らかとなった。

注意が必要であるようだ。

DASS-21 日本語版の妥当性の検討

妥当性検討の書誌はこちら。

jglobal.jst.go.jp

複写ができる。

また国会図書館にも所蔵が確認できる。

ndlonline.ndl.go.jp

こちらの内容は確認できそうだ。

DASS-15

おそらく日本語翻訳チームが作成した短縮版のようだ。
こちらの論文で使用されている。

  • Adachi, Keiichiro, Hironori Yada, and Ryo Odachi. 2021. “Examination of the Japanese Version of the Fear of COVID ‐19 Scale among Adults Using Classical Test Theory and Item Response Theory 1 2.” Japanese Psychological Research. https://doi.org/10.1111/jpr.12398. https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/jpr.12398

  • Adachi, K., & Ueno, T., (2011). Validation of the Japanese DASS (Depression Anxiety Stress Scales) 1. Proceedings of the 24th Annual Convention of the Japanese Association of Health Psychology (Tokyo, Japan), 144. (In Japanese.)

  • Adachi, K., Yoshino, M. & Ueno, T. (2013). Validation of the Japanese DASS (Depression Anxiety Stress Scales) 2. Proceedings of the 26th Annual Convention of the Japanese Association of Health Psychology (Hokkaido, Japan), 125. (In Japanese.)

この2つの学会発表は先に示したものを英語にしただけなので、中身の確認はできない。
しかし、下記の2014年の科研報告書でも妥当性や信頼性が示されていないため、2011年と2013年の論文でそれらが示されているということはなさそうだ。

科研報告書でのDASS-15

2014年(平成26年)3月の報告書でDASS-15の開発について触れられていた。

https://kaken.nii.ac.jp/ja/file/KAKENHI-PROJECT-23653216/23653216seika.pdf

サンプルは大学生443名・社会人290名・精神科クリニックに通院するものであり、因子分析をして項目数を減らしたこと、BDI-IIとSTAIとの相関を測ったことが記載されている。相関係数だけ測って妥当性や信頼性の検討を行うというMTMM Matrixになるが現実的には不可能である。DASS-15に関しては妥当性や信頼性の検討がされていないようだ。

問題点

すべての資料が手元にあるわけではないが、少なくとも言えることは尺度の信頼性・妥当性に関しては論文として公刊されないと、示したことにはならないということである。
DASS日本語版を使っている論文はすべてに問題を抱えることになる。

またDASS-15に関しては妥当性・信頼性は確認されていない。下記の論文では"Fear of COVID ‐19 Scale"との関連が示されていたが、妥当性・信頼性が確認されていない尺度を新しい尺度と比較検討するというは不適切である。

  • Adachi, Keiichiro, Hironori Yada, and Ryo Odachi. 2021. “Examination of the Japanese Version of the Fear of COVID ‐19 Scale among Adults Using Classical Test Theory and Item Response Theory 1 2.” Japanese Psychological Research. https://doi.org/10.1111/jpr.12398.