井出草平の研究ノート

ひきこもりのパラダイム転換:pathologicalひきこもりと非pathologicalひきこもりが共存する新時代

pubmed.ncbi.nlm.nih.gov

  • Kato, T. A., Sartorius, N., & Shinfuku, N. (2024). Shifting the paradigm of social withdrawal: A new era of coexisting pathological and non-pathological hikikomori. Current Opinion in Psychiatry. https://doi.org/10.1097/YCO.0000000000000929

要旨
レビューの目的 ひきこもり症候群は、日本では1990年代後半から注目されるようになった。ひきこもりは都市部に多く、精神障害と併存することが多く、今や世界中に広がっている。COVID-19以降の時代では、外出しないこと自体がもはや「ニューノーマル」としてpathological であるとは考えられておらず、ひきこもりという新しい概念が必要とされている。本総説では、ヒキコモリの概念を要約し、ヒキコモリを判別するための最新の方法を紹介する。

最近の知見
九州大学のひきこもり研究室で開発された「ひきこもり診断評価 Hikikomori Diagnostic Evaluation(HiDE)」という尺度を用いて、pathological ひきこもりと非pathological ひきこもりを区別することができる。また、非就労者を対象としたインターネット調査により、pathological ひきこもりになって3ヶ月未満の人は、特にゲーム障害やうつ病の傾向が強いことが明らかになった。

まとめ:
現在、物理的な孤立自体はpathological なものではないが、機能障害や苦痛が存在する場合には、迅速なメンタルヘルス支援が必要である。現代の新しい都市社会では、社会的孤立が引き金となる精神障害の予防のために、家に引きこもっている人が幸福なのか苦痛なのかを評価する検診システムの確立が重要である。


尺度はこちら

www.hikikomori-lab.com

TikTokの使い過ぎを評価するため尺度TikTok Use Disorder-Questionnaire(TTUD-Q)

bmcpsychology.biomedcentral.com

  • Huang, C., Guo, L., Sun, Y., Lu, J., Shan, H., Du, J., Jiang, H., Shao, S., Deng, M., Wen, X., Zhu, R., Su, H., Zhong, N., & Zhao, M. (2024). Disrupted inter-brain synchronization in the prefrontal cortex between adolescents and young adults with gaming disorders during the real-world cooperating video games. Journal of Affective Disorders, 352, 386–394. https://doi.org/10.1016/j.jad.2024.02.079

原語はドイツ語らしい。内容はICD-11のゲーム行動症の診断基準そのまま。
生活に大きな問題が生じたのはTikTokの影響なのか、原因を自己判断させているところはセンスがなさすぎる気がする。

osf.io

尺度

Die Fragen unten beziehen sich auf Ihre TikTok-Aktivitäten während des letzten Jahres(genauer gesagt bezogen auf die letzten zwölf Monaten). Bitte geben Sie an wie häufig diefolgenden Probleme im Durchschnitt über die letzten zwölf Monate hinweg bis zum heutigenTage aufgetreten sind.

  1. Ich habe Probleme gehabt, meine TikTok-Aktivitäten zu kontrollieren.
  2. Ich habe TikTok-Aktivitäten steigende Priorität gegenüber anderen Lebensinteressen undtäglichen Aktivitäten eingeräumt.
  3. Ich bin TikTok-Aktivitäten weiterhin nachgegangen, obwohl negative Konsequenzenentstanden sind (z. B. in der Beziehung, Studium oder Job).
  4. Ich habe bedeutsame Probleme in meinem Leben aufgrund der Stärke meiner TikTok-Aktivitäten erfahren.

適当な翻訳

以下の質問は、過去1年間(より具体的には過去12ヶ月間)のあなたのTikTokアクティビティに関連するものです。過去12ヶ月間における、以下の問題の平均的な頻度をお答えください。

  1. TikTokの活動を制御するのに問題があった。
  2. 私はTikTokの活動を他の生活上の興味や日々の活動よりも優先してきた。
  3. 否定的な結果(人間関係、勉強、仕事など)が出ているにもかかわらず、TikTokのアクティビティを続けている。
  4. TikTokのアクティビティが原因で、生活に大きな問題が生じたことがある。

ICCのサンプルサイズの推定[R]

ICC, 級内相関のサンプルサイズの推定。

cran.r-project.org

p、帰無仮説 p0、評価数 (k)、検出力、アルファが与えられた場合の標本サイズを計算する。また、p、p0、またはpとp0の0~1の組み合わせの異なる値の標本サイズを生成することもできる。

基になった論文はこちら。

  • Zou, G. Y. (2012). Sample size formulas for estimating intraclass correlation coefficients with precision and assurance. Statistics in medicine, 31(29), 3972-3981.

https://onlinelibrary.wiley.com/doi/abs/10.1002/sim.5466

calculateIccSampleSize(p,p0,k,alpha,tails,power,by,step)

  • p: 過去のデータや経験に基づいて推定されたpの値。デフォルトは0。
  • p0: pの帰無仮説値。省略時のデフォルトは0。
  • k: 各被験者の評価数。省略時のデフォルトは2。
  • alpha: 仮説検定に必要なアルファ値。デフォルトは0.05。
  • tails: 仮説検定のトレイルの数。省略時のデフォルトは 2。
  • power: 仮説検定の検出力。デフォルトが0.80。

p=0.80、p0=0.60、評価者2、α=0.05(両側検定)、検出力=0.80の場合のサンプルサイズを計算する。

library(ICC.Sample.Size)
calculateIccSampleSize(p=0.80,p0=0.60,k=2,alpha=0.05,tails=2,power=0.80)
   N   p  p0 k alpha tails power
1 49 0.8 0.6 2  0.05     2   0.8

p=0.9、p0=0.7、評価者2、α=0.05(両側検定)、検出力=0.90の場合のサンプルサイズを計算する。

calculateIccSampleSize(p=0.9, p0=0.70, k=2,alpha=0.05,tails=2,power=0.90)
   N   p  p0 k alpha tails power
1 30 0.9 0.7 2  0.05     2   0.9

ICCのサンプルサイズの推定[R]

ICC, 級内相関のサンプルサイズの推定。

cran.r-project.org

p、帰無仮説 p0、評価数 (k)、検出力、アルファが与えられた場合の標本サイズを計算する。また、p、p0、またはpとp0の0~1の組み合わせの異なる値の標本サイズを生成することもできる。

基になった論文はこちら。

  • Zou, G. Y. (2012). Sample size formulas for estimating intraclass correlation coefficients with precision and assurance. Statistics in medicine, 31(29), 3972-3981.

https://onlinelibrary.wiley.com/doi/abs/10.1002/sim.5466

calculateIccSampleSize(p,p0,k,alpha,tails,power,by,step)

  • p: 過去のデータや経験に基づいて推定されたpの値。デフォルトは0。
  • p0: pの帰無仮説値。省略時のデフォルトは0。
  • k: 各被験者の評価数。省略時のデフォルトは2。
  • alpha: 仮説検定に必要なアルファ値。デフォルトは0.05。
  • tails: 仮説検定のトレイルの数。省略時のデフォルトは 2。
  • power: 仮説検定の検出力。デフォルトが0.80。

p=0.80、p0=0.60、評価者2、α=0.05(両側検定)、検出力=0.80の場合のサンプルサイズを計算する。

library(ICC.Sample.Size)
calculateIccSampleSize(p=0.80,p0=0.60,k=2,alpha=0.05,tails=2,power=0.80)
   N   p  p0 k alpha tails power
1 49 0.8 0.6 2  0.05     2   0.8

p=0.9、p0=0.7、評価者2、α=0.05(両側検定)、検出力=0.90の場合のサンプルサイズを計算する。

calculateIccSampleSize(p=0.9, p0=0.70, k=2,alpha=0.05,tails=2,power=0.90)
   N   p  p0 k alpha tails power
1 30 0.9 0.7 2  0.05     2   0.9

ディスタンクシオン輪読会 第76夜

旧版p288から。

要約

政治的および道徳的な命令の二重性について論じています。著者は、活動家や政治意識の高い労働者の言葉に現れる、スタイルとトーンの変化や、同じ話の中での二つの表現スタイルの間の永続的な緊張に注目しています。一方には、あらかじめ作られた言い回しや、概念的な普遍性の色合いを与えるが、学んだレッスンのような感じや特有の非現実性を持つ政治的レキシコン(例えば「被雇用者階級の利益に反する」といった表現)があります。これらは、学校の試験のような状況に対処し、社会的地位の属性やクラスの名誉を守る能力を示すために使用されます。一方で、即時的な経験に基づく具体的な言及は、話に現実感、充実感、真実性を与え、同時に普遍化を制限する傾向があります。これらは、トーンの急激な変化によって区切られています。

言語の使用に関する研究について述べています。特に、AEERSの調査に回答した労働者たち(より高学歴で、子どもが高校や私立学校、高等教育機関に通っており、パリ在住でパリの新聞をよく読むなど、自分たちの階級からいくつかの点で異なる)の言語表現に焦点を当てています。これらの労働者たちは、書かれた言語ではさらに顕著に、公式な政治的言説の高尚さや強調を模倣しようとする様子が見られます。例えば、メカニックが「フランスの世界における使命」について語ったり、鉱山労働者が「可哀想なフランス、誰も気にしない」と発言したりする様子が挙げられています。 しかし、教育システムに関する政治的・労働組合的な言説に見られる一般化の試みがある一方で、回答は非常に個別化されています。多くの回答者は、直接的な関連がない個人的な不満を表現しているかのようです。例えば、ある農家は「教師は自分の義務を果たしておらず、休暇のことしか考えていない」と同じフレーズをすべての質問に対して答え、別の回答者は労働時間の無駄遣いについて繰り返し言及し、また別の回答者(タイピストで、夫が車体修理工)は質問の半分に対して答えず、残りの質問には「もはや職業意識がなく、レジャーのことばかり話している」と答えています。

政治的、経済的、文化的に不利な立場にある人々が、特に政治的な問題に関して、自分の意見を持つことやそれを表現する能力を身に付けることの難しさについて述べています。政治団体労働組合がこれらの人々に意見を形成する意欲や手段を提供しようとする教育活動は、一般的な形式主義と具体的な経験への直接的な参照の間で揺れ動いています。この文章は、具体的な状況への注意が信頼を得るために不可欠である一方で、個別のケースを超えて普遍的な問題に取り組むことが集団的な動員のために同じくらい重要であるというジレンマに触れています。

さらに、個人的な問題からより一般的で抽象的な問題へと徐々に移行する政治的な実践の過程が説明されています。例えば、家庭内の道徳的問題(子育て、性生活、家族内の権威など)から、教育機関学生運動に関連するような、実践的な経験から離れた問題へと話題が移り変わります。

特に、1968年の5月の出来事の後のような、既存の思考パターンや基準が問われる危機的状況では、政治的に弱い立場の人々が、彼らにとってまだ不明瞭な政治的問題(例えば学生運動)に対して、自分たちの個人的な価値観や認識スキーム(例えば「お坊ちゃんたち」への倫理的な反感や自由奔放な生活への嫌悪感)を適用し、結果として既存の秩序を守る側に加担するような状況が生じることが指摘されています。

高校での混乱や大学でのデモ、学校内の政治に関する質問が「罠」のように機能する理由について説明しています。これらの質問は、実際には既存の秩序の維持という主要な問題から生じる一連の問題という、本来の文脈でのみ意味を持つとされています。つまり、これらの質問は、自身の政策に関する意見の分布を考慮に入れなければならない人々、特に支配層にのみ関連するものとされています。この文脈では、支配層が「問題を起こす」グループについて持つ問題認識に焦点が当てられ、これらのグループ自体が抱える問題や彼らにとっての問題は無視されていると指摘しています。

政治的、経済的に不利な立場にある人々が、彼らにとって意味があいまいな質問にどのように答えるかを解説しています。彼らは、実際には既存の秩序の維持や転覆に関連する質問に対して答えているわけではなく、自分たちの階級の倫理観から生じる質問に対して答えているとされています。特に、社会的地位が低い小ブルジョアなどは、道徳的な世界観を持ち、政治的な問題に道徳的な怒りを感じる傾向があります。

このグループは、自分たちの社会的地位の低下に対する不満を、道徳的な憤りに変えて表現することが多く、その結果、反動的または革命的保守的な立場を取ることがあります。一方で、社会的地位が上昇中の小ブルジョアは、社会的な秩序が彼らの努力を十分に報酬していないと考え、その秩序に対して不満を持つことがあります。このように、彼らは既存の秩序を支持する限り、自分たちに適切な評価を与えないことに対してのみ批判的になります。このことから、保守主義者は、社会の根本的な秩序に触れない範囲での変更を受け入れることがあり、そのような変更は政治的スペクトラムの両端からの圧力によってもたらされることがあるとされています。

意見の受容者とは

「意見の受容者」とは、政治的、経済的、文化的に不利な立場にある人々、特に政治的な問題に対して自分の意見を持ったり表現したりすることが困難な人々。これらの人々は、政治団体労働組合による教育活動の対象となり、彼らが意見を形成し表現するための支援を受ける「受容者」として言及されている。彼らは、より一般的な政治的議論や専門的なレキシコンに馴染みがないため、意見形成のプロセスにおいて特別な配慮やアプローチが必要とされる対象として考えられている。

レキシコン lexique とは

「学問的な政治用語」(p.288)と翻訳されているが、ここは、レキシコンと翻訳した方が分かりやすいのではないだろうか。レキシコンというテクニカル・タームを入れた方が後々の理解が分かりやすくなるように思う。

「レキシコン」とは、ある言語の語彙(単語)全体を指す言葉で、言語学において、レキシコンはその言語を話す人々が使用するすべての単語と、それらの単語の意味、発音、使用方法などの情報を含んでいる。
この用語は、特定の分野や専門分野に関連する専門用語の集まりを指す場合もあり、政治的レキシコンは政治学や政治的な議論に関連する用語や表現を含んでいる。また、レキシコンは言語の理解やコミュニケーションのための基礎的な要素でもある。

マルクス主義とレキシコン

マルクス経済学レキシコン

www.otsukishoten.co.jp

本レキシコンは、マルクスの経済学にかんする諸著作、遺稿、書簡などのすべてから、経済学の重要な概念や問題点についての理解を深めるのに役立つと思われる叙述を、問題別に系統的に収集・整理し、編集したものである。

フランス語だとこのあたり。

www.amazon.fr

www.amazon.fr

リセと秩序問題

高校の混乱や大学のデモ、学校の政治問題についての質問は、実際にはもっと大きな問題、つまり社会の既存の秩序をどう維持するかという問題と関連していると述べられている。つまり、こうした質問は一般の人々よりも、社会の支配層や政策を決定する人たちにとって重要である。この文章では、社会の上層部が「問題を起こす」と見なすグループに焦点を当てているが、それらのグループが直面している実際の問題や彼ら自身の視点は無視されがちである。要するに、一部の人々がどのように社会問題を見るかについての話であり、それが実際の問題や異なる視点を見落としている可能性があることを示している。

ジャコバン的厳格主義

あまりどうでもよいことだが、フランスの歴史が少し関係するので、調べてみた。

ブルデューは、「ジャコバン的厳格主義(Jacobin rigourism)」は、特に社会的地位が上昇中の小ブルジョアによく見られる特定の態度や思想だと述べている。ジャコバンフランス革命期に権力を握った政治派閥で、厳格で断固とした政策や価値観を持っていた。この文脈では、「ジャコバン的厳格主義」とは、自分たちの努力や能力が社会によって十分に認められていないと感じる小ブルジョアが、社会的な秩序に対して厳格かつ批判的な態度を取ることを意味している。

これらの人々は、社会の公正さやメリット(実力)に基づいた報酬システムへの不満から、社会的な秩序や体系に対して厳しい目を向け、変化を求めることがある。彼らは、自身の地位向上のために社会的な秩序を改革しようとする意欲が強く、その過程で社会的な秩序や既存の価値観に対する厳格な批判を展開することがある。

つまり、フランス革命以後の混乱、ジャコバン派の分裂と粛清、政策的にはロベスピエールの貧者政策として小土地所有農民の形成する点にひっかけて、現代社会をアナロジカルに描いていると思われる。

下降プチブルの恨み

下降プチブルの恨みについて書かれてある。

下降プチブルは、自分たちの社会的地位の低下に対して恨みを抱いており、彼らは、社会的な秩序が彼らの努力や能力を十分に評価していないと感じており、その結果として自分たちの地位が低下していると考えている。この恨みは、社会的な地位の低下に伴う不満や不安感から生じている。

ブルジョアは通常、努力によって得られる報酬や地位を重視する傾向があり、彼らが感じている社会的な地位の低下は、そのような価値観に対する直接的な脅威となります。彼らは自分たちの努力が報われないと感じ、社会的な秩序や体系に対して不満を抱くようになる。このため、彼らは社会的な地位の低下に対する恨みを表現し、社会的な秩序に対して反動的または革命的保守的な立場を取ることがある。彼らの恨みは、自分たちの社会的な地位を維持したいという願望と、現状に対する不満から生じるものと理解できる。

lavaanの結果をcsvで書きだす[R][lavaan]

psychパッケージのbfiデータを読み込む

library("psych")
data(bfi)

lavaanパッケージでbfiデータを用い、因子分析と回帰分析を含む分析を行う

library("lavaan")
model = '
        Neuroticism =~ N1 + N2 + N3 + N4 + N5
        Extraversion =~ E1 + E2 + E3 + E4 + E5
        Neuroticism ~ gender + education + age
        Neuroticism ~~ Extraversion
        '
fit = cfa(model, data = bfi)
summary(fit, fit.measures = TRUE)

パラメータ推定結果の取得

params <- parameterEstimates(fit)

潜在変数関連のパラメータだけを抽出

# 潜在変数関連のパラメータの抽出
latent_vars <- params[params$op == "=~", ]
print(latent_vars)

共分散関連のパラメータの抽出

covariances <- params[params$op == "~~", ]
print(covariances)

回帰係数関連のパラメータだけを抽出

regressions <- params[params$op == "~", ]
print(regressions)

回帰係数関連のパラルータをcsvで書きだす

write.csv(regressions, file = "regressions.csv")

semplot

library("semPlot")
semPaths(fit, what = "std", edge.label.cex = 0.75, layout = "tree")

ロジスティック回帰におけるモデル適合度の測定

こちらの論文で挙げられている方法を検討した。

www.ncbi.nlm.nih.gov

  • Weiss, B.A. and Dardick, W. (2016) ‘An Entropy-Based Measure for Assessing Fuzziness in Logistic Regression’, Educational and Psychological Measurement, 76(6), pp. 986–1004. Available at: https://doi.org/10.1177/0013164415623820.

二項ロジスティック回帰分析の推定

例題として使うので、適当に二項ロジスティック回帰分析の推定をしておく。

library(AER)
data(CPS1985)
head(CPS1985)
      wage education experience age ethnicity region gender occupation        sector union married
1     5.10         8         21  35  hispanic  other female     worker manufacturing    no     yes
1100  4.95         9         42  57      cauc  other female     worker manufacturing    no     yes
2     6.67        12          1  19      cauc  other   male     worker manufacturing    no      no
3     4.00        12          4  22      cauc  other   male     worker         other    no      no
4     7.50        12         17  35      cauc  other   male     worker         other    no     yes
5    13.07        13          9  28      cauc  other   male     worker         other   yes      no
# 二項ロジスティック回帰分析
fit <- glm(union ~ age + gender + wage + occupation,
                  data = CPS1985, family = binomial(link = "logit"))
summary(fit)
Coefficients:
                     Estimate Std. Error z value Pr(>|z|)    
(Intercept)          -2.68778    0.46643  -5.762 8.29e-09 ***
age                   0.02968    0.01028   2.886 0.003905 ** 
genderfemale         -0.61376    0.28655  -2.142 0.032204 *  
wage                  0.08753    0.02518   3.477 0.000508 ***
occupationtechnical  -0.55867    0.33890  -1.648 0.099258 .  
occupationservices   -0.09986    0.35508  -0.281 0.778535    
occupationoffice     -1.07916    0.44743  -2.412 0.015870 *  
occupationsales      -2.76139    1.04795  -2.635 0.008412 ** 
occupationmanagement -2.54377    0.67700  -3.757 0.000172 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 503.08  on 533  degrees of freedom
Residual deviance: 437.81  on 525  degrees of freedom
AIC: 455.81

Number of Fisher Scoring iterations: 6
  

逸脱度 deviance (-2LL)

ロジスティック回帰分析では、逸脱度 (-2LL) は、適合モデルを飽和モデルと比較することで、モデルの適合の欠如を表す数学量である (Cohen, Cohen, West, & Aiken, 2003)。そのため、観察された値が期待値とどれくらい違うかを表します。尤度比は、あるモデルの最大尤度と別のモデルの最大尤度の比であり、逸脱度は尤度比の対数に(-2)を乗じて計算される。デビアンス値がゼロの場合は完全な適合を表し、値が大きい場合は適合が悪いことを示す。逸脱度は、必ずしもカイ二乗分布に従うとは限らないので、それ自体で解釈するよりも、モデル比較に有用である (O'Connell & Amico, 2010; Peng, So, Stage, & St. John, 2002)。

尤度比χ2検定

尤度比カイ2乗検定 (LR χ2) は、より小さなモデル(多くの場合、ベースラインまたは切片のみのモデル)をより大きなモデルと比較するために逸脱度を用いる。対数尤度の変化は、2つのモデル間の-2LL値の差を取ることによって計算さ れる。-2LLの差はカイ2乗分布に従うので、その値はカイ2乗臨界値と比較できる。統計的に有意な結果は、より多くの予測変数を持つモデルが、より少ない予測変数を持つモデルよりも統計的に有意によくデータに適合することを示す。この検定の利点は、理論モデルがベースライン・モデルよりもよく適合するかどうかを決定するのに有用であり、入れ子モデルを比較する統計的検定として使用できることである。LR χ2 は、データが疎であるとき(しばしば連続的に測定される予測変数が使用されるときの結果)、または標本サイズが大きいときのデータ-モデル適合の限定された測定である。

Hosmer-Lemeshowカイ二乗検定

Hosmer-Lemeshowカイ二乗検定も適合度検定の一種で、データが疎な場合に有用である。この統計量は、予測された確率をパーセンタイル・ランクに基づく10個のグループ(十分位)に分割し、Pearson χ2を計算して、観察された度数と期待される度数を比較する。非統計的に有意な結果は、データとモデルの適合が良好であることを示す。この統計量は、保守的な検定(すなわち、低い第一種過誤率; Peng et al., 2002)とみなされ、連続予測変数が使用される場合に有用である。この尺度は、検出力の欠如を批判され、したがって、n > 400の場合のみ推奨される (Hosmer & Lemeshow, 2000)。対照的に、カイ2乗検定は、一般に標本サイズに非常に敏感で、したがって、大きなnでは、しばしば統計的に有意な結果(データ・モデルの適合が悪いことを示す)を出す。したがって、この検定の理想的な検出力のために必要な標本サイズのコンセンサスはありません。さらに、この尺度は、十進分類を作成するために使用されるカット・ポイントに敏感であり、したがって、数値HL χ2値は、ソフトウェア・プログラムによって異なる可能性がある(Hosmer, Hosmer, Le Cessie, & Lemeshow, 1997; Peng et al., 2002)。

Hosmer-Lemeshowカイ二乗検定の実行

すべてnumeric型にしないと走らないので、変数をいじる必要がある。

library(dplyr)

CPS1985$gender.num <- CPS1985$gender
CPS1985 <- CPS1985 %>%
  mutate(gender.num = case_when(
      gender.num == "male" ~ 1,
      gender.num == "female" ~ 2))

CPS1985$occupation.num <- CPS1985$occupation
CPS1985 <- CPS1985 %>%
  mutate(occupation.num = case_when(
      occupation.num == "worker" ~ 1,
      occupation.num == "technical" ~ 2,
      occupation.num == "services" ~ 3,
      occupation.num == "office" ~ 4,
      occupation.num == "sales" ~ 5,
      occupation.num == "management" ~ 6
      ))

CPS1985$union.num <- CPS1985$union
CPS1985 <- CPS1985 %>%
  mutate(union.num = case_when(
      union.num == "yes" ~ 1,
      union.num == "no" ~ 0))


### 従属変数のみのデータをpredprobに格納
predprob <- data.frame(age = CPS1985$age, gender = CPS1985$gender,
                       wage = CPS1985$wage, occupation = CPS1985$occupation)

### numeric型の変数を用いたモデルを作成
fit2 <- glm(union.num ~ age + gender.num + wage + occupation.num,
                  data = CPS1985, family = binomial(link = "logit"))

### Hosmer-Lemeshow検定を実行
hl_gof <- hoslem.test(CPS1985$union.num, fitted(fit2), g = 10)
hl_gof

5%水準以下の小さなP値は、モデルが不完全であることを示唆する。

 Hosmer and Lemeshow goodness of fit (GOF) test

data:  CPS1985$union.num, fitted(fit2)
X-squared = 3.5246, df = 8, p-value = 0.8973

擬似R二乗(分散説明)尺度

ロジスティック回帰では、モデルがデータにどれだけよく適合するかの効果量測定として、いくつかの擬似分散説明尺度が使用されることがある(たとえば、McFaddenのR2, Cox & Snell, 1989; Nagelkerke, 1991)。これらは、通常の最小2乗(OLS)回帰における多重R2と同様に解釈されることを意図しているが、カテゴリー的な結果の分散が連続的な結果の分散と異なるので、擬似R2指標とみなされる(Lomax & Hahs-Vaughn, 2012)。 これらの指標は、0から1の範囲(1はより良いデータ・モデル適合を示す)を意味するが、Cox and Snell (1989) の指標が1.0に等しくなることは数学的に不可能であり、どの擬似分散説明指標についても推奨されるカットオフ値は現在のところ存在しない。これらのうち、McFaddenのR2指数は、その解釈が重回帰のR2に最も似ているため、最も直感的に理解できますが、多くの市販統計ソフトでは利用できないため、手作業で計算しなければならず、一部の応用研究者にとっては望ましくない尺度となっています (O'Connell & Amico, 2010; Peng et al., 2002)。さらに、どの擬似R2値を報告するのが望ましいかについては、研究者の間でも意見が分かれている(O'Connell & Amico, 2010)。

RではDescToolsパッケージを用いて容易に計算ができる。

library(DescTools)
PseudoR2(fit, which = "all")
       McFadden     McFaddenAdj        CoxSnell      Nagelkerke   AldrichNelson VeallZimmermann           Efron McKelveyZavoina            Tjur 
     0.12973875      0.09395945      0.11505302      0.18855166      0.10891512      0.22452336      0.12640844      0.28229487      0.12434253 
            AIC             BIC          logLik         logLik0              G2 
   455.81462887    494.33819142   -218.90731444   -251.54206888     65.26950888 

正確性 accuracy / 正しく分類されたケースの割合

多くの研究者は、観察されたグループ・メンバーシップと予測されたグループ・メンバーシップのクロス集計を含む分類表に依存している。バイナリ・ロジスティック回帰では、予測確率が0.5以上のケースは、通常1つのグループに分類され、一方、予測確率が0.5未満のケースは、2番目のグループで予測されたグループ・メンバーシップになる(ただし、必要であれば、研究者は0.5以外のカット・ポイントを選択できる)。クロス集計表に基づいて、正しく分類されたケースのパーセンテージが計算され、データ・モデルの適合の尺度として使用できる。バイナリ・ロジスティック回帰のケースでは、分類率の値は、50% から100%の正しい分類の範囲であり、より大きな値は、よりよいデータ・モデルの適合を示す。

正しい分類のパーセンテージは、観察された頻度の小さいグループの誤分類率が大きいこと(特に、あるグループの標本サイズが小さいとき)、1つまたは複数のグループの潜在的な悪い分類率、したがって、分類率内のこれらのグループの過小表現、および基本率または偶然の分類が組み込まれていないこと(Lomax & Hahs-Vaughn, 2012; O'Connell & Amico, 2010)により、データ・モデルの適合の効果的な尺度でないと批判されることが多い。さらに、モデルはデータによく適合していると考えられるが、分類率が低いという状況も起こり得る。

正確性 accuracy の計算

回帰分析の推定結果を計算し、それを2値データに変換する。これが推定値である。
一方でもともとの従属変数がある。従属変数に比べて、推定モデルによって推定された結果は何%あっているのか、という計算をする。

caretパッケージのconfusionMatrix関数を使う。計算はnumeric型でしかできないため、先ほどの二項ロジスティック回帰分析の従属変数であった、unionをunion.numという変数にコピーして、これをnumeric型に変換しておく。

比較のための変数を作成する

## dplyrでCPS1985$unionのyesを1に、noを0に変換する
library(dplyr)
 CPS1985$union.num <- CPS1985$union
CPS1985 <- CPS1985 %>%
  mutate(union.num = case_when(
      union.num == "yes" ~ 1,
      union.num == "no" ~ 0))
library(caret)

### type = "response" 各観測に対して予測確率を与える
pred_probs <- predict(fit, CPS1985, type = "response") 

### 予測値を2値変数に変換する
pred_diagn <- ifelse(pred_probs > 0.5, 1, 0)

### 混同行列と精度
caret::confusionMatrix(data = as.factor(pred_diagn), 
                       reference = as.factor(CPS1985$union.num))

結果

Confusion Matrix and Statistics

          Reference
Prediction   0   1
         0 431  89
         1   7   7
                                         
               Accuracy : 0.8202         
                 95% CI : (0.785, 0.8519)
    No Information Rate : 0.8202         
    P-Value [Acc > NIR] : 0.5272         
                                         
                  Kappa : 0.0854         
                                         
 Mcnemar's Test P-Value : <2e-16         
                                         
            Sensitivity : 0.98402        
            Specificity : 0.07292        
         Pos Pred Value : 0.82885        
         Neg Pred Value : 0.50000        
             Prevalence : 0.82022        
         Detection Rate : 0.80712        
   Detection Prevalence : 0.97378        
      Balanced Accuracy : 0.52847        
                                         
       'Positive' Class : 0 

この二項ロジスティック回帰モデルの正確性82.02%であった。

ROC曲線 Receiver Operating Characteristic Curves

モデルがデータに合っているかどうかを判断するために使用できる視覚的な検査方法もいくつかある。ROC曲線は、感度(真陽性、すなわち、イベントとして正しく分類されたケースのパーセンテージ)と1-特異度(偽陽性、すなわち、イベントとして誤って分類されたケースのパーセンテージ)を比較する。したがって、ROC曲線は、ある割合の症例を正しく分類するために、誤分類される必要のある症例の割合を示している。ROC 曲線は、0.50以外のカット・ポイントを識別するためのバイナリ・ロジスティック回帰でも有用である。

AUC; Area Under the Receiver Operating Characteristic Curve

ROC曲線の主な限界は、ROC曲線は視覚的な検査しかできないため、データとモデルの適合に関する解釈が主観的であることである。しかし研究者は、ROC曲線を用いて曲線下面積(AUC)を計算することができる。AUCは、データ-モデル適合の尺度として使用できる単一の数値を報告することで、曲線を定量化する。概念的には、AUCは一致確率であり、無作為に選んだ陽性症例が無作為に選んだ別の陰性症例より高いスコアを出す確率である。曲線が左上隅に近いほど、AUCは大きい。二項ロジスティック回帰では、AUCは0.5 から 1.0の範囲で、値が高いほどデータ・モデルの適合がよいことを示す。AUC は、Wilcoxonの順位検定と同じ結果を生成する (Streiner & Cairney, 2007)。経験則として、AUC値が0.5~0.7は低いとみなされ、0.7~0.9は中程度、0.9より大きい値は高いとみなされる(Streiner & Cairney, 2007)。t検定は、AUCが0.5から統計的に有意に異なるかどうかを決定するために計算することができる。統計的に有意なAUC値は、モデルが偶然よりもよく適合していることを示す。研究者によっては、AUC推定値の周りの95%信頼区間を報告する。

データとモデルの適合の尺度としてROC曲線とAUCを用いることには多くの問題がある。第一に、感度と特異度の値はカットポイントがどこにあるかによって決まるため、AUCは無限に計算できる。さらに、ROC曲線は分散を考慮しておらず、ROC曲線が交差する可能性があるため、直接比較できないことから、モデル比較にROC曲線を使用することに注意を促す研究者もいる(Fawcett, 2005; Streiner & Cairney, 2007)。

注:AUCは要するに順序に関する計算であり、分散が考慮されないということ。

ROC曲線下面積(AUC)

正確性加えて、ROC曲線下面積(AUC)は、モデルの予測可能性を評価するために用いることができる。AUCが高いほど良いモデルである。

AUC曲線の計算を行う。

## 真の値と予測確率のデータフレームを作成する
eval_df <- data.frame(CPS1985$union.num, pred_probs)
colnames(eval_df) <- c("truth", "pred_probs")
eval_df$truth <- as.factor(eval_df$truth)

### AUCを計算する
library(yardstick)
roc_auc(eval_df, truth, pred_probs, event_level = "second")

結果

  .metric .estimator .estimate
  <chr>   <chr>          <dbl>
1 roc_auc binary         0.755

AUCスコアは75.50%であった。

次に、ggplot2でROC曲線をプロットする。

library(yardstick)
library(ggplot2)
library(dplyr)

## plot ROC
roc_curve(eval_df, truth, pred_probs, event_level = "second") %>% 
    ggplot(aes(x = 1 - specificity, y = sensitivity)) +
    geom_path() +
    geom_abline(lty = 3, col = "red") + 
    coord_equal() +
    theme_bw()

フィッティングされたモデルのAUCは75.50%で、このモデルは予測可能性が高いことを示している。

予測確率のヒストグラム Histogram of Predicted Probabilities

最後に、予測確率のヒストグラム(分類プロットとも呼ばれる)と結果は、予測の質を調べるために使用できる。このヒストグラムは、視覚的に有益なグラフで、偽陽性のパーセント、偽陰性のパーセント、および正しい分類のパーセントを提供する。よく区別された予測を示すために、分類プロットは、次の特徴を持つべきである:(1) U字形(正規分布よりもむしろ)、(2) ケースがそれぞれの端に集まっている(すなわち、カット・ポイントからより離れている、通常、二項ロジスティック回帰では0.5)、(3) 分類における最小のエラー(すなわち、わずかな偽陽性とわずかな偽陰性)。ヒストグラムは、正しい分類のパーセンテージとグループ間の分離をグラフィカルに描写することによって、分類率の測定を補足する。残念ながら、AUCがROC曲線を定量化するように、このヒストグラムに含まれる情報を定量化する単一の数値は存在しない。

hist(fitted(fit))