ネット依存傾向とネット使用時間に関連はあるのか

ネット依存傾向とネット使用時間の関連は研究によって結果が必ずしも一致していない。今回は北田雅子さんの論文を見てみたい。論文の主旨からは逸れるが、両者の関連について二次分析を行った。統計パッケージはRを使用した。

ci.nii.ac.jp

北田(2019)では、ヤングのインターネット依存傾向が用いられている。

20項目の質問項目について、「いつもある」「よくある」「ときどきある」「まれにある」「全くない」の5件法で尋ね、それぞれ1点から5点で合計して算出する。合計得点は、ヤングの区分に即して、70~100点(ネット依存的傾向高)、40~69点(ネット依存的傾向中)、20~39点(ネット依存的傾向低)で区分した。

ヤングのインターネット依存傾向は総務省情報通信政策研究所(2013)『青少年のインターネット利用と依存傾向に関する調査』で日本語に訳出されている。(なお、この尺度はバックトランスレーションや基準関連妥当性の検討が行われておらず、研究に使うのはやや問題がある。)

ネット依存傾向尺度と1日のネット利用時間について検定は行われていない。下記のようなクロス表が示されている。

f:id:iDES:20200301161638p:plain

二次分析

検定が行われていないので、カイ二乗検定を行ったところp=.004737で統計学的に有意差があることがわかった。

dm1 <- matrix(c(1,1,4,0,8,15,1,42,30,3,34,12), nrow=4, ncol=3, byrow=T)
dm1
res1 <- chisq.test(dm1, correct = TRUE) # with Yates's correction for continuity
res1
res1$stdres

調整済み標準化残差で傾向を読もうとしたが、変則的である。この分布はこれで興味深い。

      [,1]       [,2]       [,3]
[1,]  1.8657472 -1.9968336  1.3381957
[2,] -0.9639533 -2.2587010  2.6347576
[3,] -1.2898288  0.2978646  0.1692327
[4,]  1.3381113  2.2487061 -2.7610905

0セルが含まれるなどカイ二乗検定をするには適しているとは言えないため、連続変数に変換して分散分析を行うことにした。使用時間「1時間~3時間以内」は中央値をとって2時間とリコードした。ケースデータへの変換(元データへの復元) は以前のエントリの方法を用いている(参照)。

元データに復元

df1 <- as.data.frame(dm1)
library(tidyverse)
df3 <- df1 %>%
      rownames_to_column() %>%            # set row names as a variable
      gather(rowname2,value,-rowname) %>% # reshape
      rowwise() %>%                       # for every row
      mutate(value = list(1:value)) %>%   # create a series of numbers based on the value
      unnest(value) %>%                   # unnest the counter
      select(-value)                      # remove the counts

データフレームの加工

colnames(df3) <- c("playtime","addiction") # change row name
df4 <- df3[cbind(-2,-3),] # omit 2-3 row
table(df4) # confirm table

値の変更とデータ型の変更

library(car)
library(memisc)
df6 <- df4 # copy
df6$playtime <- car::recode(df6$playtime, "1=15; 2=45; 3=120; 4=270") #recode
df6$addiction <- memisc::recode(df6$addiction, "high" <- "V1", "middle" <- "V2", "low"<-"V3") #recode
str(df6) # comfirm data type

再分析の結果

分散分析の結果P=.00272で統計学的に有意になった。 依存が高い群の平均値は189時間、中等度は172時間、低い群は124時間であった。

分散分析

res3<- aov(playtime ~ addiction, data = df6) # ANOVA
summary(res3) # show result
with(df6, tapply(playtime, addiction, mean, na.rm=TRUE)) # calc average value

結果。

Df  Sum Sq Mean Sq F value  Pr(>F)   
addiction     2   86886   43443   6.147 0.00272 **
Residuals   148 1045907    7067                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
high   middle      low
189.0000 171.7059 124.1803

結果

このデータでは、依存尺度とネット利用時間には関連があることがわかった。