井出草平の研究ノート

R

間接法による年齢標準化と信頼区間[R]

直接法はこちら。 年齢調整罹患率(age-standardized rates)の求め方の一つ。 ides.hatenablog.com 間接法により得られる値は、正確には年齢調整罹患率ではなく、期待値と観測値の比である。 対象とする地域(例えば市町村)の年齢階級別罹患率が、比較しよ…

直接法による年齢標準化と信頼区間[R]

epitoolsパッケージを用いた直接法による年齢標準化(調整)率および「正確な」信頼区間の算出。 こちらの例から。 www.rdocumentation.org データはこの本からとられている。 Statistical Methods for Rates and Proportions (Wiley Series in Probability …

ANOVA その8 問題集

実際にやってみたところこの問題集の出来が良くないことが発覚したので注意 次の質問では、yarrrパッケージのpiratesデータフレームを使用する。 海賊の好きなpixar映画とタトゥーの数には有意な関係があるか? fav.pixarを独立変数、tattoosを従属変数とし…

ANOVA その7 ANOVAオブジェクトからの追加情報の取得

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAオブジェクトからは、多くの興味深い情報を得ることができる。1つに保存されているすべてを見るには、ANOVAオブジェクト上でコマンドを実行する。 二元配置分散分析(Two-way ANOVA)のデータをもう少し…

ANOVA その6 Type I, Type II, and Type III ANOVA

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAには、タイプ1、2、3(またはタイプI、II、III)と呼ばれる3つの異なるタイプがある。これらのタイプは、分散(特に二乗和)の計算方法が異なる。データが比較的バランスのとれたもの、つまり各グルー…

ANOVA その5 二元配置分散分析(Two-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org 二元配置のANOVAを行うには、回帰モデルの式に+印で追加の独立変数を入れるだけであるこれだけです。すべてのステップは同じだ。。クリーナーとタイプの両方を独立変数とした二元配置のANOVAを行ってみよ…

ANOVA その4 一元配置分散分析(One-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org poopdeckのデータに一元配置のANOVA(one-way ANOVA)の実行例をする。掃除時間を従属変数に、クリーナーの種類を独立変数にしする。データをpirateplotで表すことができる。 library(yarrr) head(poopdeck) …

ANOVA その3[R]

ANOVAを行うための4つのステップ。 こちらの続き。 ides.hatenablog.com bookdown.org ここでは、Rで標準的なANOVAを行うために必要な4つのステップを紹介する。 aov()関数を使ってANOVAオブジェクトを作成する。aov()関数では、y ~ x1 + x2という形式の式で…

ANOVA その2[R]

こちらの続き。 ides.hatenablog.com bookdown.org 完全要因被験者間分散分析(Full-factorial between-subjects ANOVA) 分散分析(ANOVA)には、分析しているデータの種類に応じて多くの種類がある。ANOVAには非常に多くの種類があり、1つのタイプと別のタイ…

ROC曲線と正診率[R]

ROC(Receiver Operating Characteristic)曲線は、X軸に偽陽性率、Y軸に真陽性率をとって描かれる。 ROCは、すべての陽性を識別するために、どれだけの間違いを犯しているかがわかる。 今回は正診率について。 ROC曲線下の面積およびブートストラップによる…

感度・特異度の計算[R]

2×2の分割表における感度・特異度その他、もろもろの計算方法について。 epiRパッケージを利用する。 www.rdocumentation.org 例1 Scott et al. (2008)表1より。新しい診断テストが1586人の患者に試行された。疾患陽性の744人の患者のうち、670人が検査陽性…

repolrパッケージで順序ロジスティック回帰での結果をMplusで検算[R][Mplus]

こちらでの計算をMplusで検算する。 ides.hatenablog.com Mplus用のデータの書き出し insomnia<-read.csv("insomnia.csv",header=TRUE) insomnia<-as.data.frame(insomnia) head(insomnia) library(MplusAutomation) variable.names(insomnia) # 変数名を書…

repolrパッケージで順序ロジスティック回帰[R]

Agrestiの本で示されている例を実行してみたい。 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics Book 656) (English Edition)作者:Agresti, AlanWileyAmazon コード集のみ、サプリメントとしてネット公開されている。 …

順序ロジスティック回帰とBrant検定[R]

前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…

順序ロジスティック回帰[R]

idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…

flextableパッケージでRで作成した表をWordやPowerPointに出力する[R]

こちらを参照した。 taehoonh.me 使用するのはflextableパッケージ www.rdocumentation.org データの呼び込み library(tidyverse) dat <- mtcars[, 1:6] %>% mutate(model = rownames(mtcars)) %>% select(ncol(.), 1:(ncol(.)-1)) mtcarsの頭部分を使用する…

ガンマ分布のglm()モデリング[R]

rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…

ガンマ分布の一般線形モデル[R]

waferデータセットの読み込み library(faraway) data(wafer) waferデータセットを添付 attach(wafer) 半導体実験におけるウエハの感度のデータだ。 https://www.rdocumentation.org/packages/faraway/versions/1.0.7/topics/wafer x1 x2 x3 x4 resist 1 - - …

ANOVA その1[R]

bookdown.org Nathaniel D. PhillipsさんのR解説から。 第14章 ANOVA 図14.1: メナージュ・ア・トロワMenage a troisのワイン - 三元配置分散分析に最適な組み合わせ 前章では、1標本および2標本の仮説検定を取り上げた。これらの検定では、1つのグループを…

factor型やcharacter型の"NA"をNA(欠損値)にする方法[R]

少し困ったのでメモ。 dplyr.tidyverse.org dplyrパッケージを使うと楽なようだ。 na_if(data, "NA") "NA"→NAになり、欠損値にすることができる。

Rでのリコード[R]

頻繁に使うのに忘れてしまうコードなので、メモ。 サンプルデータの呼び出し library(AER) #パッケージの呼び出し。CPS1985というデータがこのパッケージに含まれている data(CPS1985) #CPS1985データの行頭のみ表示 memiscパッケージ library(memisc) CPS19…

lavaanを用いてWLSMVによる測定の不変性を計算する[R]

WLSMV(adjusted diagonally weighted least squares)での測定の不変性の方法が確立しているらしい。 https://www.tandfonline.com/doi/abs/10.1080/10705511.2019.1602776 最尤法での測定の不変性についてはこちらを参照のこと。 ides.hatenablog.com サンプ…

正規性の検定

日本語でも解説が多く、有名な手法なので、やり方だけを記す。 データはirisを用いる。 ガクの長さのデータが正規分布が仮定できるかを検定する。 data(iris) head(iris$Sepal.Length) データ。 [1] 5.1 4.9 4.7 4.6 5.0 5.4 シャピロ・ウィルク検定 (Shapir…

Rでクラスター分析[R]

Gabriel Martosさんによる解説より。 rstudio-pubs-static.s3.amazonaws.com Rを使ってクラスター分析を行う方法を学ぶ。データセットwinsを使用するために,ライブラリrattleをロードする。 library(rattle) data(wine, package='rattle') head(wine) Type …

prevalenceパッケージまわりの補足[R]

こちらのエントリの補足。 ides.hatenablog.com 感度・特異度がわかっていれば、スクリーニング調査から真の有病率の推定ができる、という手法である。 もちろん、統計的推計なので、診断の有無をしっかりと調べていくようなものを再現できる訳ではなく、い…

LaTeX形式の数式コードを書くパッケージequatiomatic[R]

中澤港さんの日記に書かれていたパッケージ(https://minato.sip21c.org/im3r/20210131.html)。 これを使うと,lmer()で使ったモデルが,そのままTeXのコードになる。LaTeXで論文を書いている人はそのまま取り込めるし,WordやLibreOfficeで論文を書いている…

lavaanを用いた測定不変性の確認[R]

lavaanで測定普遍性を確認する方法。 rstudio-pubs-static.s3.amazonaws.com ある構成要素についてグループ間で比較を行うとき、暗黙のうちに測定の不変性を仮定している。回帰分析、t検定、混合効果モデルなどを行っている時も、その構成要素が同じように機…

lavaanのモデルの尤度比検定[R]

lavTestLRT関数を用いる。昔のバージョンではanova(fit1, fit0)という書き方をしたようだが、現在はlavTestLRT関数に変更されている。 www.rdocumentation.org LRTはLikelihood-ratio testつまり尤度比検定である。ブートストラップをかけて行うとBLRTである…

複数グループのCFAのフィッティング指標[R]

複数グループに分けての確証的因子分析。 とりあえずの用途としては、構成概念妥当性を調べる際に複数グループのフィッティング指標を見るというもの。測定の不定性と言われるもの(Measurement Invariance)である。 lavaan.ugent.be グループ変数は"school"…

Wilcoxon-Mann-Whitney検定[R]

ja.wikipedia.org 昔SPSSでやった記憶はあるがRではやったことがない。 少し調べてみるとx群とy群をそれぞれベクトルで与えてwilcox.test(x,y)とするみたいな解説がたくさん見つかった。間違いではないが、一つの連続変数に対して男女の違いはあるかないかみ…