ネット依存傾向とネット使用時間の関連は研究によって結果が必ずしも一致していない。今回は北田雅子さんの論文を見てみたい。論文の主旨からは逸れるが、両者の関連について二次分析を行った。統計パッケージはRを使用した。
北田(2019)では、ヤングのインターネット依存傾向が用いられている。
20項目の質問項目について、「いつもある」「よくある」「ときどきある」「まれにある」「全くない」の5件法で尋ね、それぞれ1点から5点で合計して算出する。合計得点は、ヤングの区分に即して、70~100点(ネット依存的傾向高)、40~69点(ネット依存的傾向中)、20~39点(ネット依存的傾向低)で区分した。
ヤングのインターネット依存傾向は総務省情報通信政策研究所(2013)『青少年のインターネット利用と依存傾向に関する調査』で日本語に訳出されている。(なお、この尺度はバックトランスレーションや基準関連妥当性の検討が行われておらず、研究に使うのはやや問題がある。)
ネット依存傾向尺度と1日のネット利用時間について検定は行われていない。下記のようなクロス表が示されている。
二次分析
検定が行われていないので、カイ二乗検定を行ったところp=.004737で統計学的に有意差があることがわかった。
dm1 <- matrix(c(1,1,4,0,8,15,1,42,30,3,34,12), nrow=4, ncol=3, byrow=T) dm1 res1 <- chisq.test(dm1, correct = TRUE) # with Yates's correction for continuity res1 res1$stdres
調整済み標準化残差で傾向を読もうとしたが、変則的である。この分布はこれで興味深い。
[,1] [,2] [,3] [1,] 1.8657472 -1.9968336 1.3381957 [2,] -0.9639533 -2.2587010 2.6347576 [3,] -1.2898288 0.2978646 0.1692327 [4,] 1.3381113 2.2487061 -2.7610905
0セルが含まれるなどカイ二乗検定をするには適しているとは言えないため、連続変数に変換して分散分析を行うことにした。使用時間「1時間~3時間以内」は中央値をとって2時間とリコードした。ケースデータへの変換(元データへの復元) は以前のエントリの方法を用いている(参照)。
元データに復元
df1 <- as.data.frame(dm1) library(tidyverse) df3 <- df1 %>% rownames_to_column() %>% # set row names as a variable gather(rowname2,value,-rowname) %>% # reshape rowwise() %>% # for every row mutate(value = list(1:value)) %>% # create a series of numbers based on the value unnest(value) %>% # unnest the counter select(-value) # remove the counts
データフレームの加工
colnames(df3) <- c("playtime","addiction") # change row name df4 <- df3[cbind(-2,-3),] # omit 2-3 row table(df4) # confirm table
値の変更とデータ型の変更
library(car) library(memisc) df6 <- df4 # copy df6$playtime <- car::recode(df6$playtime, "1=15; 2=45; 3=120; 4=270") #recode df6$addiction <- memisc::recode(df6$addiction, "high" <- "V1", "middle" <- "V2", "low"<-"V3") #recode str(df6) # comfirm data type
再分析の結果
分散分析の結果P=.00272で統計学的に有意になった。 依存が高い群の平均値は189時間、中等度は172時間、低い群は124時間であった。
分散分析
res3<- aov(playtime ~ addiction, data = df6) # ANOVA summary(res3) # show result with(df6, tapply(playtime, addiction, mean, na.rm=TRUE)) # calc average value
結果。
Df Sum Sq Mean Sq F value Pr(>F) addiction 2 86886 43443 6.147 0.00272 ** Residuals 148 1045907 7067 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 high middle low 189.0000 171.7059 124.1803
結果
このデータでは、依存尺度とネット利用時間には関連があることがわかった。