井出草平の研究ノート

R

順序ロジスティック回帰モデルとBrant検定[R]

前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…

順序ロジスティック回帰[R]

idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…

flextableパッケージでRで作成した表をWordやPowerPointに出力する[R]

こちらを参照した。 taehoonh.me 使用するのはflextableパッケージ www.rdocumentation.org データの呼び込み library(tidyverse) dat <- mtcars[, 1:6] %>% mutate(model = rownames(mtcars)) %>% select(ncol(.), 1:(ncol(.)-1)) mtcarsの頭部分を使用する…

ガンマ分布のglm()モデリング[R]

rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…

ガンマ分布の一般線形モデル[R]

waferデータセットの読み込み library(faraway) data(wafer) waferデータセットを添付 attach(wafer) 半導体実験におけるウエハの感度のデータだ。 https://www.rdocumentation.org/packages/faraway/versions/1.0.7/topics/wafer x1 x2 x3 x4 resist 1 - - …

ANOVA その1[R]

bookdown.org Nathaniel D. PhillipsさんのR解説から。 第14章 ANOVA 図14.1: メナージュ・ア・トロワMenage a troisのワイン - 三元配置分散分析に最適な組み合わせ 前章では、1標本および2標本の仮説検定を取り上げた。これらの検定では、1つのグループを…

factor型やcharacter型の"NA"をNA(欠損値)にする方法[R]

少し困ったのでメモ。 dplyr.tidyverse.org dplyrパッケージを使うと楽なようだ。 na_if(data, "NA") "NA"→NAになり、欠損値にすることができる。

Rでのリコード[R]

頻繁に使うのに忘れてしまうコードなので、メモ。 サンプルデータの呼び出し library(AER) #パッケージの呼び出し。CPS1985というデータがこのパッケージに含まれている data(CPS1985) #CPS1985データの行頭のみ表示 memiscパッケージ library(memisc) CPS19…

lavaanを用いてWLSMVによる測定の不変性を計算する[R]

WLSMV(adjusted diagonally weighted least squares)での測定の不変性の方法が確立しているらしい。 https://www.tandfonline.com/doi/abs/10.1080/10705511.2019.1602776 最尤法での測定の不変性についてはこちらを参照のこと。 ides.hatenablog.com サンプ…

正規性の検定

日本語でも解説が多く、有名な手法なので、やり方だけを記す。 データはirisを用いる。 ガクの長さのデータが正規分布が仮定できるかを検定する。 data(iris) head(iris$Sepal.Length) データ。 [1] 5.1 4.9 4.7 4.6 5.0 5.4 シャピロ・ウィルク検定 (Shapir…

Rでクラスター分析[R]

Gabriel Martosさんによる解説より。 rstudio-pubs-static.s3.amazonaws.com Rを使ってクラスター分析を行う方法を学ぶ。データセットwinsを使用するために,ライブラリrattleをロードする。 library(rattle) data(wine, package='rattle') head(wine) Type …

prevalenceパッケージまわりの補足[R]

こちらのエントリの補足。 ides.hatenablog.com 感度・特異度がわかっていれば、スクリーニング調査から真の有病率の推定ができる、という手法である。 もちろん、統計的推計なので、診断の有無をしっかりと調べていくようなものを再現できる訳ではなく、い…

LaTeX形式の数式コードを書くパッケージequatiomatic[R]

中澤港さんの日記に書かれていたパッケージ(https://minato.sip21c.org/im3r/20210131.html)。 これを使うと,lmer()で使ったモデルが,そのままTeXのコードになる。LaTeXで論文を書いている人はそのまま取り込めるし,WordやLibreOfficeで論文を書いている…

lavaanを用いた測定不変性の確認[R]

lavaanで測定普遍性を確認する方法。 rstudio-pubs-static.s3.amazonaws.com ある構成要素についてグループ間で比較を行うとき、暗黙のうちに測定の不変性を仮定している。回帰分析、t検定、混合効果モデルなどを行っている時も、その構成要素が同じように機…

lavaanのモデルの尤度比検定[R]

lavTestLRT関数を用いる。昔のバージョンではanova(fit1, fit0)という書き方をしたようだが、現在はlavTestLRT関数に変更されている。 www.rdocumentation.org LRTはLikelihood-ratio testつまり尤度比検定である。ブートストラップをかけて行うとBLRTである…

複数グループのCFAのフィッティング指標[R]

複数グループに分けての確証的因子分析。 とりあえずの用途としては、構成概念妥当性を調べる際に複数グループのフィッティング指標を見るというもの。測定の不定性と言われるもの(Measurement Invariance)である。 lavaan.ugent.be グループ変数は"school"…

Wilcoxon-Mann-Whitney検定[R]

ja.wikipedia.org 昔SPSSでやった記憶はあるがRではやったことがない。 少し調べてみるとx群とy群をそれぞれベクトルで与えてwilcox.test(x,y)とするみたいな解説がたくさん見つかった。間違いではないが、一つの連続変数に対して男女の違いはあるかないかみ…

変数名を変更する[R]

names(df)[ c(1,3)] <- c("一列目", "三列目") via: Rで列名を変更する: さかなのいろいろ

ベイズ推定による因子分析[Mplus]

頻度主義で行うのと特に何かが変わるというわけではないものの、Mplusでベイズ推定で因子分析を行った。 コード DATA: FILE = "HS1939.dat"; VARIABLE: NAMES = x1 x2 x3 x4 x5 x6 x7 x8 x9; MISSING=.; ANALYSIS: ESTIMATOR = BAYES; PROCESS = 2; FBITER =…

ID番号のないデータフレームにID列を作る方法[R]

IDの列を作る 仮想データフレームを作成。 d <- data.frame(V1=c(23, 45, 56), V2=c(45, 45, 67)) 結果。 V1 V2 1 23 45 2 45 45 3 56 67 ID列の挿入。 d$ID <- 1:nrow(d) 結果。 V1 V2 ID 1 23 45 1 2 45 45 2 3 56 67 3 こちらで紹介されていたやり方。パ…

lavaanで潜在変数の相関係数を求める[R]

データとモデルの作成 library("lavaan") Data <- HolzingerSwineford1939[,c("x1","x2","x3","x4", "x5", "x6")] model <- ' f1 =~ x1 + x2 + x3 f2 =~ x4 + x5 + x6 ' fit <- sem(model, data = Data, std.lv = TRUE) lavaanパッケージに含まれているデー…

lavaanでポリコリック、ポリシリアル相関係数を計算する[R]

Rではpolycorパッケージで計算ができる。 ides.hatenablog.com Stataでも現在は標準で計算機能が実装されている。 ides.hatenablog.com ポリコリック相関係数などは以前のエントリーを参照のこと。 lavCor www.rdocumentation.org 下記のものは、パッケージ…

lavaanで順序尺度のSEMを行う[R]

相関係数をピアソンではなく、ポリコリック相関係数を使う方法。例として簡単な確証的因子分析を行う。 サンプルデータの作成 library(lavaan) data.con <- HolzingerSwineford1939[,c("x1","x2","x3")] # visualのデータのみ使用 ## 3カテゴリにしてカテゴ…

潜在クラス分析におけるBCH法-回帰補助モデル[Mplus]

前回に引きつづき潜在クラス分析におけるBCH法について。 http://www.statmodel.com/examples/webnotes/webnote4.zip 今回は共変量(X)を設定し、従属変数(Y)に回帰するモデルである。 データが見つからなかったのでRで仮想データ作成した。適当に乱数を発生…

vcdパッケージでKappaと重みづけKappaを計算する[R]

コーエンのκ係数(Cohen's kappa)と重みづけκ係数(Weighted kappa)の計算をRのvcdパッケージで行う。 irrパッケージは通常の個票データからの計算が想定されているが、vcdパッケージはクロス表からの計算を想定して作られている。 データ anxiety <- as.table…

Rのパッケージ一覧[R]

cran.r-project.org 一部日本語化しているページ www.trifields.jp

Light’s KappaとFleiss' kappa[R]

評価者が3人以上、評価項目が名義尺度で3カテゴリ以上で利用される一致度の指標である。有名なCohen's Kappa(κ) の拡張版である。 Light’s Kappa 評価者が2人以上、2つ以上のカテゴリカル変数で使用する一致度の指標である。 RのirrパッケージでLight’s Kapp…

合成信頼性を計算する[R]

合成信頼性(Composite Reliability)はCronbach'αの代替指標として使われているものである。 semToolsで最後まで計算できると思っていたが、そうではなかったらしいので計算方法を再度調べてみた。 合成信頼性の解釈 合成信頼性(construct reliabilityと呼ば…

平均分散抽出(AVE)をsemToolsで計算する[R]

平均分散抽出average variance extracted (AVE) 。Fornell&Larcker基準とも言われている。 rdrr.io 計算 library(semTools) HS.model <- ' visual =~ x1 + x2 + x3 textual =~ x4 + x5 + x6 speed =~ x7 + x8 + x9 ' dat <- HolzingerSwineford1939[, paste…

参照カテゴリの変更[R]

メモ。 relevel(変数, ref="参照カテゴリ名") Factor型の場合、最初の数を参照カテゴリにするのかとおもいきや、そうでもなかったので一瞬困った。