Rで相関プロットを描く

相関分析を視覚的に認識するために、相関プロットは有効である。特に、二次分析の際などに威力を発揮するかもしれない。二次分析は仮説があってそれを検証すために調査を作れるわけではないので、どの部分を分析するか、総当たりで検証することもあるからだ。やってみたらこうなった的で良くないプロセスだが、二次分析というビハインドがある場合には致し方ないこともあるだろう。

相関プロットを描画するにはcorrplotパッケージを利用する。

サンプルデータとしてMASSパッケージに含まれるBostonデータを使用する。比較的連続変数が多いデータである。

library(MASS)
data(Boston)
num <- c(1:3,5:8,10:14) # 連続変数は1~3、5~8、10~14列目。列番号をnumに格納。
d1 <- Boston[num] #連続変数だけのデータをd1に格納。

以下で相関プロットを作っていく。

library("corrplot")
res <- cor(d1, method = "pearson")
corrplot(corr = res, type="upper")

f:id:iDES:20190913052408p:plain

相関の強さが色の濃さと円の大きさで確認できる。

相関係数を重ねて描画することもできる。 オプションでaddCoef.colを付け加える。値は文字の色である。blackの方がわかりやすいかもしれない。

corrplot(corr = res, type="upper", addCoef.col="gray" )

f:id:iDES:20190913052420p:plain

これだと文字が重なってよくわからない。そういう場合には、画像サイズを先に指定しておくと解決できる。

png(height=800, width=800, pointsize=15, file="corrplot02.png")
corrplot(corr = res, type="upper", addCoef.col="black" )

heightは画像の高さ、widthは幅、pointsizeは文字の大きさで、file=はファイル名である。ファイルは作業ディレクトリに出力される。文字の重なりは、画像の大きさと文字の大きさを変更すると調整できる。

f:id:iDES:20190913052436p:plain

相関の強弱であればプラスかマイナスかはあまりどうでもいいという考え方もあるので、その場合には絶対値をつけてタイルで表示させるとオシャレ感が増す。

corrplot(corr = abs(res), method="color", tl.pos="n", cl.lim = c(0,1))

f:id:iDES:20190913052513p:plain

モザイクタイルのようなものが出来上がる。男子トイレに貼られることの多いタイル建材だ。

色を変えたいときには、以下のようにする。

corrplot(corr = abs(res), method="color", tl.pos="n",
          cl.lim = c(0,1), col=colorRampPalette(c("black","white","black"))(200))

f:id:iDES:20190913052553p:plain

白と黒だと印刷するときに便利かもしれない。 200と最後についているのは白から黒までの段階を何段階にするか、という指定である。

corrplot(corr = abs(res), method="color", addCoef.col="black",
              tl.pos="n", cl.lim = c(0,1))

相関係数の値も付与できる。

f:id:iDES:20190913052606p:plain

Rで共変量プロットを描く

Rで共変量プロットを描く。

library(AER)
data(CPS1985)
fit <- lm(formula = wage ~ education + age +
       gender + occupation + union,
       data = CPS1985)
summary(fit)

結果の表示。

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)          -1.86545    1.37469  -1.357 0.175368    
education             0.59565    0.09350   6.370 4.13e-10 ***
age                   0.09476    0.01656   5.723 1.77e-08 ***
genderfemale         -1.81460    0.41555  -4.367 1.52e-05 ***
occupationtechnical   1.53776    0.68990   2.229 0.026240 *  
occupationservices   -1.34311    0.60762  -2.210 0.027507 *  
occupationoffice     -0.58774    0.63256  -0.929 0.353245    
occupationsales      -1.20902    0.81515  -1.483 0.138626    
occupationmanagement  2.82736    0.75765   3.732 0.000211 ***
unionyes              1.58683    0.50749   3.127 0.001865 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

信頼区間は次のように出力する。95%と90%を設定する。それぞれ5%有意と10%有意に相当する。

confint(fit, level = 0.95)
confint(fit, level = 0.90)

それぞれの結果の表示。

                        2.5 %     97.5 %
(Intercept)          -4.56604008  0.8351387
education             0.41196295  0.7793276
age                   0.06222812  0.1272862
genderfemale         -2.63095640 -0.9982519
occupationtechnical   0.18244561  2.8930780
occupationservices   -2.53677803 -0.1494321
occupationoffice     -1.83041166  0.6549327
occupationsales      -2.81038993  0.3923436
occupationmanagement  1.33895379  4.3157634
unionyes              0.58986138  2.5837930
                         5 %       95 %
(Intercept)          -4.13062657  0.3997252
education             0.44157788  0.7497127
age                   0.06747275  0.1220416
genderfemale         -2.49933668 -1.1298716
occupationtechnical   0.40096199  2.6745617
occupationservices   -2.34432325 -0.3418869
occupationoffice     -1.63005678  0.4545778
occupationsales      -2.55220306  0.1341567
occupationmanagement  1.57892791  4.0757893
unionyes              0.75060125  2.4230531

このままでは少し見づらいので、共変量プロットで図で確かめる。

library(coefplot)
coefplot(fit)

f:id:iDES:20190911050257p:plain

ゼロに掛かっていないものが有意である。横長のものが90%信頼区間で、短い方が95%信頼区間である。

デュルケムの契約の非契約的要素

ci.nii.ac.jp

流王貴義さんのデュルケムの議論。

本稿は「契約における非契約要素」とは契約法である,との解釈を提示する.

僕はデュルケム研究者ではないので、あまりよく知っているわけではないが、このタイプの解釈は初めて見た気がする。

契約の非契約的要素

契約における非契約的要素とは「『社会分業論』におけるスペンサー批判の論点を,パーソンズが定式化したものである(Parsons[1937]1949: 311-4, 19)」。スペンサーにとって契約とは私的な利害追求であることが多く、私的で自由な合意だとしたことに対して、デュルケムは契約は契約だけでは成立しないとした。

契約を交わしてもの条文や約束の文言自体に規則を守る効力はない。規則の以前に個々人が規則を守る前提のようなものが必要である、というのが、契約における非契約的要素である。契約における「前」契約要素と言うこともある。

流王さんによると研究者の解釈は3つに分かれるという。

1つ目は,集合意識として理解する見解,具体的には,「契約に対する社会的規制力」(杉山 1988: 81),「集合意識の規制力」(鈴木 1990: 67),契約の両当事者が備える「『神聖なもの』『畏敬の念を引き起こすもの』である『人格』という『属性』」(巻口 1999: 104)という理解である.
2つ目は,個々の契約に先立つ連帯として理解する見解,具体的には,「契約に先立つ連帯」「信頼」(Collins 1982:12),「契約の相手方への信頼」(中島 2001: 53)という理解である.
3つ目は,契約に拘束力を与える社会的規制と考える見解, 具体的には,「拘束力を与える一群のルール」(Parsons[1937]1949: 311),契約に「拘束力を与え,その実施の条件」(Lukes 1973: 146)を定めるもの,「分散している社会諸機能が調和的な協働を維持するための『固定性』あるいは『規則性』の確保」(芦田 1981: 91-2)を目的としたサンクションという理解である.

個人的には2つ目の解釈に近い感じで読んできたように思う。

1つ目の人格崇拝解釈はデュルケムは確かに人格崇拝について述べているが、後世の研究者が切り取って発展させた印象が強い。デュルケムにとっても主たる関心ではなかったはずで、デュルケム研究としてはあまり関心を持てない解釈である。

2つ目のコリンズら解釈について、「この理解は『社会分業論』の内在的な読解から引き出されたものではない」という指摘を流王さんは行っているが、この点はまったくその通りだと思う。

この解釈は『分業論』以降の著作を併せて解釈したものである。『自殺論』以降の著作であれば、どの著作でも議論可能だと思うのだが、後期の『道徳教育論』が最も理論が定式化されているように思う。『社会分業論』では、道徳の第1要素である「規律の精神」は道徳の第2要素である「社会集団への愛着」を前提とすることによって成立すると論じられている。

われわれは前回の講義において,道徳の第二要素を決定したが,それは,個人が,所属する社会集団にたいして愛着することにあった.道徳性は,われわれが何らかの人間集団の一員となるというだけで,すでに生ずるものである.じっさい,人間は,いくつかの社会に同時に属することによってのみ完全となるように,道徳性自体もまた,われわれが,自己の組入れられている様々な種類の社会(家族・同業組合・政治結社・祖国・人類)に連帯感を持つことによって,はじめて完全なものになるのである(Durkheim 1925=1964 : 上115).

道徳の第2要素である「社会集団への愛着」はコリンズ的に言えば「契約に先立つ連帯」であったり「信頼」に相当する。

しかし、3階建ての理論もありうるかもしない。道徳の第2要素の集団への愛着があり、それが前提となって、道徳の第1要素である「規律の精神」が成り立ち、それを前提として、契約が守られるようになっているという3階建てなのかもしれない。であれば、2階にあたる規律の精神は、上記の3つ目のパーソンズらの解釈である「契約に拘束力を与える社会的規制」ということになる。

このようにレイヤーを増やしていくと、パーソンズ解釈でも良い気がするが、いずれにしろ『社会分業論』に限定したテキストの解釈としては妥当性に欠けるだろう。

「契約の非契約的要素=契約法」説

鍵となるのは,先に挙げた引用文の理解である.契約に法的保護が与えられるには,「一定の条件を満たしている」(194)必要があるとデュルケムは考えている.ではなぜ「契約当事者間の意思の一致」(194)が「一定の条件」を満たしていれば, 契約と認められ,法的保護を受けられるのか.それは,この「一定の条件」を満たす契約は,「社会的価値を持っている」(82),即ち「社会的諸機能の調和的な協働」を害さない,と評価されているからである.ではどのようにすれば契約の社会的価値を判断できるのか.デュルケムが提示するのは,「法的規則(règlesdu droit)に合致」(83)しているか否か,という基準である.この「法的規則」こそが,本稿が「契約における非契約的要素」の内容であると解釈する契約法である.
(中略)
合意であれば何であれ拘束力を認めるのではなく,社会的諸機能の調和という見地から,法的保護の付与されるべき合意に限定を掛ける必要性こそ,個々の契約に対する契約法の積極的な規整としてデュルケムが考えていた役割なのである.

流王さんの試みは旧来の解釈にレイヤーを差し込んで、デュルケムの契約法に関する理解を深めるものに思えた。このあたりの議論はまだまだ可能性があるため、いろいろと読んでみたい気がした。

コマンドラインにふりながを打つ

CUIコマンドライン、など呼び方はいくつかあるが、統計処理をする際にコマンドを打つ作業が求められることがある。統計学の習得をする際にコマンドを打つという作業でつまづく人は多いらしい。

計量の研究者でもSPSSやAMOSだったらできるが、RやMplusは無理という人も存在いる。学生向けの授業で無料だからRを使うなどをしてしまうと、間違いなく問題が起こる。統計学の学習以前の所で、呪文のようなものがいっぱい並んでいてわからなくなる学生が続出する。

スラスラ読める JavaScriptふりがなプログラミング

スラスラ読める JavaScriptふりがなプログラミング

この本はJavaScriptの解説書で統計学とは関係ないが、CUIの習得に非常に良い方法な気がしたので、エントリしてみた。スラスラ読めるシリーズは他の言語でも出版されているので、JavaScript本でなくてもよい。

f:id:iDES:20190902170916p:plain

これを日本語と変換した読み下し文がセットになっている。

f:id:iDES:20190902170928p:plain

このアイデアをRやMplusにも応用したら、理解してもらえるのではないか、と思った。

HTMLで書くとレイアウト的にいまいちだが、Rの重回帰にふりがなを打つと、次のような感じになる。

lm線形回帰(formula = wage賃金(独立変数) ~チルダの後に従属変数 gender性別 + age年齢,コンマで区切るdata = CPS1985データ名)

CUIに抵抗感がない(むしろCUIの方が良いと考えている)人は特殊なのかもしれない。僕の場合、最初に使ったパソコンにはWindows3.1が搭載されていたので、GUIからの出発だった。しかし、当時はMS-DOSを使わないとできないこともたくさんあったので、かなり最初の段階からCUIMS-DOSを使わざるを得なかった。その後、HTMLを学ぶあたりから、CUIの方が快適と感じるようになってきた気がする。CUIを使う機会があると苦手感がない=苦手な人の気持ちがわからなくなってくるのかもしれない。

SPSSでステップワイズ回帰

SPSSでもステップワイズ回帰をやっておこうと思う。

重回帰分析

データは先のエントリと同じくCPS1985を使っている。
通常通り線形回帰のダイアログボックスを表示させる。

f:id:iDES:20190902023107p:plain

方法を「ステップワイズ法」にすればステップワイズ回帰になる。

REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA SELECTION
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN
  /DEPENDENT wage
  /METHOD=STEPWISE education experience age ethnicity region gender occupation sector union married.    

GUIからはできなかったと思うのだが、ANOVAのあとにSELECTIONを入れておくとACIやBICが出力できる。

f:id:iDES:20190902023144p:plain

赤池情報基準がAIC、Schwarzのベイズ基準がBICである。SPSSはR二乗値でモデルの選択を行っているようだ。AICはR二乗値と同じ結果を支持しているが、BICはモデル4を支持している。

IBMの解説ページ(英語)
https://www.ibm.com/support/knowledgecenter/en/SSLVMB_24.0.0/spss/tutorials/reg_cars_stepwise_01.html シンタックス(英語)
https://www.ibm.com/support/knowledgecenter/en/SSLVMB_24.0.0/spss/base/syn_regression_method.html

ロジステック回帰分析

ロジスティック回帰でもステップワイズ回帰はできるようだ。

f:id:iDES:20190902023214p:plain

方法のところを「強制投入法」から「変数減少法:尤度比」に変更するだけだ。
図では結婚を推定する変数の探索をする形になっている。

シンタックスは以下のようになる。

LOGISTIC REGRESSION VARIABLES married
 /METHOD=BSTEP  (LR) wage education experience age ethnicity region gender occupation sector union
 /CATEGORICAL ethnicity region gender occupation sector union
 /CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5).

変数減少法はBSTEP尤度比は(LR)である。 一部を強制投入法、一部をステップワイズ法で分析する場合、は以下のように投入法を行ごとに変更する。

/METHOD=ENTER  wage education
/METHOD=BSTEP  (LR) experience age ethnicity region gender occupation sector union

GUIで行う場合には、ブロック1で強制投入法をして、ブロック2で「変数減少法:尤度比」とすると同じようになる。

シンタックス(英語)
https://www.ibm.com/support/knowledgecenter/en/SSLVMB_23.0.0/spss/regression/syn_logistic_regression_method.html

ちなみにSPSSのフリーのクローンソフトウェアであるPSPPではステップワイズ回帰は実行できないようだ。

Rでステップワイズ回帰

ステップワイズ回帰とは説明する変数(独立変数)に何を入れれば、最も説明力が高いモデルが作れるかを自動的に考えてくれるという方法だ。日本語ではSASのJMPのページの解説がよさそうに思えた。

www.jmp.com

PCで統計パッケージを使って行えば、自動的に最もフィッティングの良いモデルの選択ができる、という触れ込みだが、実際には使うべきではない。仮説の無いデータ分析をすることがNGであることはウェブにもよく書いてあることだが、技術的にも、リッジ回帰、LASSO、Elastic Netといった洗練された方法があるので、現代でステップワイズ回帰をわざわざ行う理由が見当たらない。

ステップ関数を利用したステップワイズ回帰

ステップワイズ回帰はRの標準機能で走らせることができる。

まずはデータを読み込む。よく利用しているAERパッケージに含まれるCPS1985を今回も使って説明してみる。

データの読み込み。

library(AER)
data(CPS1985)

CPS1985には下記の変数が含まれている。

  • wage...賃金
  • education...教育年数
  • experience...就労年数
  • age...年齢
  • ethnicity...エスニシティ
  • region...地域
  • gender...性別
  • 職業...occupation
  • sector...職種
  • union...組合加入
  • married....結婚

賃金を説明するモデルをステップワイズ回帰で求めてみよう。

fit1 <- lm(formula = wage ~ education + experience + age + ethnicity
            + region + gender + occupation + sector + union + married,
            data = CPS1985) # fit1に回帰モデルを格納する

res1 <- step(fit1) #格納した回帰モデルfit1をステップ関数で分析

summary(res1) #結果表示

回帰モデルをstep()に入れればそれでOKだ。非常に簡単。
Rだとフィッテングを判断するのはAICである。

Step:  AIC=1564.76
wage ~ education + experience + region + gender + occupation + union

             Df Sum of Sq     RSS    AIC
<none>                     9599.4 1564.8
- region      1     50.52  9649.9 1565.6
- union       1    163.53  9762.9 1571.8
- gender      1    362.48  9961.9 1582.5
- occupation  5    684.51 10283.9 1591.5
- experience  1    587.41 10186.8 1594.5
- education   1    845.68 10445.1 1607.8

説明モデルとして採用されたのは、以下の変数である。

  • education...教育年数
  • experience...就労年数
  • region...地域
  • gender...性別
  • occupation...職業
  • union...組合加入

下の部分は変数を投入した場合のAICが表示されている。
<none>と書いてある行が最適だと判断されたモデルの統計量である。AICは1564.8となっている。一つ下にあるregion(地域)を入れたもののAICが1565.6になり、モデルのフィッティングが悪くなっていることがわかる。

MASSパッケージを用いてステップワイズ回帰

MASSパッケージを使ってもステップワイズ回帰ができる。ノーマルなステップワイズ回帰であれば、ステップ関数を使ったものと同じものが出力されるのであまり出番はないかもしれない。

library(MASS)
res2 <- stepAIC(fit1, direction="both")
res2$anova

結果表示の最後に$anovaをつけないと、変数の入れ替えでのAICの変化が表示されないので、MASSパッケージを使う際にはつける必要がある。

direction="both"はデフォルト値なので入れなくてもよい。bothは変数増減法を指定するオプションで変数増加法と変数減少法もあるが、特に変えなくても良いと思う。ステップワイズ回帰は総当たり方式ではないので、この部分の指定によって違ったモデルが最適だと出力される場合があり、どのような順番で変数を検討しているかは統計パッケージで異なるので、どこかに結果を出す場合には、ソフトウェアとどのような方法で変数選択を行ったかを書いた方が良い。

stepAIC {MASS}
https://stat.ethz.ch/R-manual/R-devel/RHOME/library/MASS/html/stepAIC.html

選択されモデルの交互作用項のリストワイズ回帰

MASSパッケージでは、交互作用の分析もできる。
さきほど、分析で選択された変数で新しい回帰モデルをつくる。
scope=list(upper=~X1 * X2 * ... * Xn, lower=~1)の中に回帰分析と同じ変数をいれる。アスタリスクは交互作用を意味している。

fit2 <- lm(formula = wage ~ education + experience + 
                region +gender + occupation + union, 
               data = CPS1985)  
              # 選択された変数で構成した回帰モデル
res3 <- stepAIC(fit2,scope=list(upper=~education * experience *
                          region * gender * occupation * union, lower=~1),
                          direction="both")
                         # 交互作用の検討
res3$anova # 結果の表示

結果は以下のようになる。

Initial Model:
wage ~ education + experience + region + gender + occupation +
    union

Final Model:
wage ~ education + experience + region + gender + occupation +
    union + experience:gender + education:region + education:experience +
    education:union + education:occupation + experience:union +
    education:experience:union


                          Step Df  Deviance Resid. Df Resid. Dev      AIC
1                                                 523   9599.374 1564.757
2          + experience:gender  1 103.62041       522   9495.753 1560.961
3           + education:region  1  64.37861       521   9431.375 1559.328
4       + education:experience  1  57.80331       520   9373.571 1558.045
5            + education:union  1  64.71459       519   9308.857 1556.346
6       + education:occupation  5 204.93102       514   9103.926 1554.459
7           + experience:union  1  72.08144       513   9031.844 1552.214
8 + education:experience:union  1 106.19011       512   8925.654 1547.898

Final Modelが選択されたモデルである。交互作用項が7つ含まれている。

交互作用項を含めたVIFの出力

このようなモデルだと多重共線性も検討したい。VIFの出力はcarパッケージに入っているので、さきほどのステップワイズ回帰で出力されたモデルをそのまま入れてみよう。

library(car)
fit3 <- lm(formula =wage ~ education + experience + region +
                gender + occupation +  union + experience:gender +
                education:region + education:experience +
                education:union + education:occupation + 
                experience:union +  education:experience:union,
                data = CPS1985)
vif(fit3)

結果は以下のようになる。

                                   GVIF Df GVIF^(1/(2*Df))
education                  1.345057e+01  1        3.667502
experience                 2.725167e+01  1        5.220313
region                     2.880692e+01  1        5.367208
gender                     3.444389e+00  1        1.855907
occupation                 2.969113e+08  5        7.034977
union                      1.419677e+02  1       11.915022
experience:gender          4.597440e+00  1        2.144164
education:region           3.378791e+01  1        5.812737
education:experience       2.331528e+01  1        4.828590
education:union            1.343270e+02  1       11.589952
education:occupation       3.895536e+08  5        7.228642
experience:union           9.909437e+01  1        9.954616
education:experience:union 8.924635e+01  1        9.447029

全体的に数値が高い。VIFは大きさだけでは判断できないとはいえ、このモデルはおそらくダメなモデルである。

ロジットモデルのステップワイズ回帰

例として、結婚を推定する変数を探索するロジットモデルのステップワイズ回帰のスクリプトを書いた。
SPSSでは(おそらく)重回帰のステップワイズ分析くらいしかできなかったと思うがやってみたらできた。

fit4 <- glm(formula = married ~ wage+ education + experience + age + ethnicity
            + region + gender + occupation + sector + union, family=binomial,
            data = CPS1985)
res4 <- step(fit4)
summary(res4)

MASSパッケージを用いる場合次のように書く。

res5 <- stepAIC(fit4, direction="both")
res5$anova

調査における反応歪曲

Satisficeのことを書きながら、「ちゃんと調査を受けてくれない人がいる」というののは、MMPIでも似たような議論があったぞ、と思い出したので、メモをしておこうと思う。

心理尺度のつくり方

心理尺度のつくり方

MMPIについてはWikipediaなどを参照のこと。
ミネソタ多面人格目録 - Wikipedia

反応歪曲

村上本の69-71頁にかけて反応歪曲についての記載がある。

大部分の人は質問紙に正直に回答するが,1~2割の人は自分を偽って回答する可能性がある。建前的回答は意識に上らないことも多い。逆に自分を実際よりも悪いとみなし,精神病者のような回答をすることもある。このような現象を反応歪曲(response set)と呼ぶ。

この界隈では、YG性格検査などで反応歪曲についての論文はわりと書かれている印象がある。 ここで挙げられている反応歪曲のパターンは3つ。

1) 黙従傾向:質問項目がどんな内容であっても,同意する傾向を黙従傾向(acquiescence)と呼ぶ。つまり「はい」か「いいえ」ばかりで答える傾向である。

2) 社会的望ましさ:社会的に望ましいと思われる回答をする傾向である。このような反応傾向は社会的望ましさ(social desirebility)と呼ぶ。

3) 良いふり,悪いふり,でたらめ応答:MMPI関連で言及される反応歪曲で,社会的望ましさの概念と一部重複する。良いふりは「生まれて一度も嘘はついたことがありません」などという質問をいくつか用意して,肯定的回答を集計すると検出できる。古典的なL尺度である。悪いふりは,自己意識が非常に悪く,精神病者のように回答する傾向である。でたらめ応答は,テストを嫌々やったり,質問文の意味が理解できず,回答がでたらめになってしまった場合がある。これらの傾向はL,F,K尺度で検出できる。

精神病者と書いてあるが、精神病「質」者の間違いであろう。精神病者だと統合失調症などであり、回答もままならない。細かく言うと精神病質者は社会の何が善で悪なのかを知っているので、悪ぶっているわけではなく、その本質が邪悪なのである。悪ぶっているのは、ADHDを基盤として反抗的なパーソナリティを持つ一群である。

MMPIは本体とは別に妥当性尺度がある。

  • ?尺度(疑問点) 被験者が「どちらともいえない」と答えた項目の数を表しており、これが多い場合は妥当性が疑わしくなるため、判定の中止、あるいは再検査を検討する必要がある。
  • L尺度(虚構点) Lはうそ(Lie)を表し、社会的には望ましいが実際には困難で、被験者が自分を好ましく見せようとする傾向を示唆する。
  • F尺度(妥当性点) 正常な成人においては出現率の低い回答をした数を表しており、風変わりな回答や自分を悪く見せようとする傾向が現れる。
  • K尺度(修正点) 自己に対する評価、検査に対する警戒の程度を調べるもので、これが高いほど自己防衛の態度が高いといえる。また自己に対する評価、検査に対する警戒による回答の歪みを修正するための点数としても扱われる。

LはLie、Fはfaking bad、Kは何の頭文字かはわからない。Defensivenessと説明されることが多い。MMPIにK項目を追加のはMeehl & Hathaway(1946)だが、この論文を(かなり)ざっくり読んだがKが何を意味しているのかわからなかった。

BigFiveでは,300項目の試作版質問紙と同時にMINI性格検査を実施して,L,F,建前尺度が70点以上の者と,K尺度が30点以下の者を除外した。被検者は大学生で,当初496名であったが,除外すると443名となった(村上・村上,1997)。これだけで有効回答者の10.7%である。不完全回答者は前もって除外されている。 多くの研究者は被検者の洗練を意識的に行なっていない。作成する尺度の弁別力に影響するはずである。自己像が歪んだ,洞察力の乏しい被検者は1~2割いるので,可能ならば,試作版質問紙にL,F,K尺度などを含めておいて除外すべきである。

村上・村上(1997, https://www.jstage.jst.go.jp/article/jjpjspp/6/1/6_KJ00001287054/_article/-char/ja/)をみれはL項目で引っかかった人数が書いてあるかと思ったが、確認してみても、この本と同様の記述しかなかった。各尺度での反応歪曲の割合はわからない。

L尺度は15項目で構成されている。MMPIには著作権があって貼ることはできないので、慣例的によく例示としてあげられる英語の文章を4つあげておこう。

15 Once in a while I think of things too bad to talk about.
45 I do not always tell the truth.
75 I get angry sometimes.
150 I would rather win than lose in a game.

話すのを憚れるほど悪いことを考えていると供述する可能性は低い(15)。いつも本当のことを言っている人と答える人は自分をよく見せようと嘘をついている(45)。まったく怒らない人はいないので、時々でも怒らないと回答する人は嘘をいている(75)。ゲームに負ける方が好きな人はいないので、勝つ方がよいと答えない人は嘘をついている(150)。

被検者の洗練が必要

L,F,Kでは使い道が違いそうである。特にポリティカル・コレクトネスが関係するものを検討する際には必要かもしれない。例えば、人種差別をしてもよいか、と質問をすると、内心はどう思っていたとしても、人種差別はダメなことだと言う人が多い。女性の社会進出なども同様で、女性はもっと社会進出をすべきと口では言いながら、女は仕事ができない、会社に来ても雑用だけしかやらせない、家事は女がするべきと固い信念(偏見)を持っている人は少なくない。

社会学の調査はこの種のことにはあまり関心を持っていない。「多くの研究者は被検者の洗練を意識的に行なっていない」と村上が述べるように、可能な限り、さまざまな形で嘘を書く人を検出するシステムを調査に組み込んだ方が良いように思う。自分をよく見せようとする人が1~2割くらいいるのは現実的だし、それだけの割合の回答が歪むと、分析をしても正しい結果が出るはずがない。わりと重要なトピックだと思う。