井出草平の研究ノート

R

ベイズ法・ポワソンモデルを用いたクロス集計表の分析

クロス表データのベイズ分析のために使用できるいくつかの可能性があるモデルがある。 クロス表の各セルでの頻度に対するいわゆる対数線形モデル(ポアソン・モデル)。各セルのデータの比率の推定値を得るための二項モデルである。カイ二乗検定よりもさらに…

correlationパッケージ[R]

自動で相関係数を一気に計算するパッケージの一つ。サンプルデータはmtcarsを用いる。 cran.r-project.org easystats.github.io data(mtcars) head(mtcars,5) データ。 mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 1…

パス解析・直接効果・間接効果[Mplus][R]

UCLA: Statistical Consulting Groupのページから。 stats.oarc.ucla.edu UCLAではMplusのコードが書かれているが、このエントリでは、同じ分析をRのlavaanでの再現したいと思う。 Mplus パス解析はすべての変数が観測される方程式系を推定するために使用さ…

plmパッケージを用いたパネルデータ分析[R]

こちらの資料がソース。 rstudio-pubs-static.s3.amazonaws.com https://dss.princeton.edu/training/Panel101R.pdf plmパッケージ rdrr.io https://cran.r-project.org/web/packages/plm/plm.pdf データの読み込み library(foreign) Panel <- read.dta("htt…

performanceパッケージ[R]

easystats.github.io CRAN: https://cran.r-project.org/web/packages/performance/index.html rdrr.io: https://rdrr.io/cran/performance/ YouTubeでの解説(英語) www.youtube.com コードの使用法 https://rdrr.io/cran/performance/f/README.md 回帰モデ…

マハラノビス距離による外れ値の検索[R]

rpubs.com Rのマハラノビス()関数は、多次元データの外れ値を検出する簡単な手段を提供する。 例えば、身長と体重のデータフレームがあるとする。 hw <- data.frame(Height.cm=c(164, 167, 168, 169, 169, 170, 170, 170, 171, 172, 172, 173, 173, 175, 176…

データフレームの行列入れ替え[R]

data <- t(data) ameblo.jp www.marsja.se

条件を指定して行を削除する[R]

www.datasciencemadesimple.com 特定の列の特定の値のケースを削除 サンプルデータを作成 df1 = data.frame(Name = c('George','Andrea', 'Micheal','Maggie','Ravi','Xien','Jalpa'), Grade_score=c(4,6,2,9,5,7,8), Mathematics1_score=c(45,78,44,89,66,4…

データフレームにID列を追加する[R]

statisticsglobe.com サンプルデータを作る。 data <- data.frame(x1 = 15:10, x2 = letters[1:6], x3 = 4, row.names = LETTERS[16:21]) data データ。 x1 x2 x3 P 15 a 4 Q 14 b 4 R 13 c 4 S 12 d 4 T 11 e 4 U 10 f 4 例1:cbind関数とnrow関数を使って…

級内相関[R]

級内相関(intraclass correlation coefficients: ICC)連続変数における評価者内・評価者間の信頼性の指標である。 ICCにはShrout and Fleiss(1979)によるとCase1,Case2,Case3の3種類がある。 Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlati…

順序α (Ordinal Alpha)[R]

クロンバッハのαの順序尺度版。 digitalcommons.wayne.edu リッカート尺度で構成された尺度の内的一貫性・内的整合性(internal consistency)を求める際に使う価値がある方法である。 パッケージを用いた計算 ufsというパッケージ。もともとはuserfriendlysci…

まとめてT検定を行う その1[R]

こちらの方の解決法。 www.rpubs.com おそらくこのブログを書いておられる方。 https://blog.goo.ne.jp/r-de-r 同じグループ間(治療群対プラセボ群)で異なる変数(年齢、身長、体重、罹病期間、疾患など)について複数のt検定(またはウィルコクソン検定)…

for文[R]

statisticsglobe.com 例1: Rでベクトルをループする この例では、for-loopを使ってベクトル上をループする方法を説明する。 i in 1:10: iの中に1]から10までを代入していく i^2: 計算式 for(i in 1:10) { # for文ヘッド x1 <- i^2 # コードブロック print(x1…

間接法による年齢標準化と信頼区間[R]

直接法はこちら。 年齢調整罹患率(age-standardized rates)の求め方の一つ。 ides.hatenablog.com 間接法により得られる値は、正確には年齢調整罹患率ではなく、期待値と観測値の比である。 対象とする地域(例えば市町村)の年齢階級別罹患率が、比較しよ…

直接法による年齢標準化と信頼区間[R]

epitoolsパッケージを用いた直接法による年齢標準化(調整)率および「正確な」信頼区間の算出。 こちらの例から。 www.rdocumentation.org データはこの本からとられている。 Statistical Methods for Rates and Proportions (Wiley Series in Probability …

ANOVA その8 問題集

実際にやってみたところこの問題集の出来が良くないことが発覚したので注意 次の質問では、yarrrパッケージのpiratesデータフレームを使用する。 海賊の好きなpixar映画とタトゥーの数には有意な関係があるか? fav.pixarを独立変数、tattoosを従属変数とし…

ANOVA その7 ANOVAオブジェクトからの追加情報の取得

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAオブジェクトからは、多くの興味深い情報を得ることができる。1つに保存されているすべてを見るには、ANOVAオブジェクト上でコマンドを実行する。 二元配置分散分析(Two-way ANOVA)のデータをもう少し…

ANOVA その6 Type I, Type II, and Type III ANOVA

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAには、タイプ1、2、3(またはタイプI、II、III)と呼ばれる3つの異なるタイプがある。これらのタイプは、分散(特に二乗和)の計算方法が異なる。データが比較的バランスのとれたもの、つまり各グルー…

ANOVA その5 二元配置分散分析(Two-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org 二元配置のANOVAを行うには、回帰モデルの式に+印で追加の独立変数を入れるだけであるこれだけです。すべてのステップは同じだ。。クリーナーとタイプの両方を独立変数とした二元配置のANOVAを行ってみよ…

ANOVA その4 一元配置分散分析(One-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org poopdeckのデータに一元配置のANOVA(one-way ANOVA)の実行例をする。掃除時間を従属変数に、クリーナーの種類を独立変数にしする。データをpirateplotで表すことができる。 library(yarrr) head(poopdeck) …

ANOVA その3[R]

ANOVAを行うための4つのステップ。 こちらの続き。 ides.hatenablog.com bookdown.org ここでは、Rで標準的なANOVAを行うために必要な4つのステップを紹介する。 aov()関数を使ってANOVAオブジェクトを作成する。aov()関数では、y ~ x1 + x2という形式の式で…

ANOVA その2[R]

こちらの続き。 ides.hatenablog.com bookdown.org 完全要因被験者間分散分析(Full-factorial between-subjects ANOVA) 分散分析(ANOVA)には、分析しているデータの種類に応じて多くの種類がある。ANOVAには非常に多くの種類があり、1つのタイプと別のタイ…

ROC曲線と正診率[R]

ROC(Receiver Operating Characteristic)曲線は、X軸に偽陽性率、Y軸に真陽性率をとって描かれる。 ROCは、すべての陽性を識別するために、どれだけの間違いを犯しているかがわかる。 今回は正診率について。 ROC曲線下の面積およびブートストラップによる…

感度・特異度の計算[R]

2×2の分割表における感度・特異度その他、もろもろの計算方法について。 epiRパッケージを利用する。 www.rdocumentation.org 例1 Scott et al. (2008)表1より。新しい診断テストが1586人の患者に試行された。疾患陽性の744人の患者のうち、670人が検査陽性…

repolrパッケージで順序ロジスティック回帰での結果をMplusで検算[R][Mplus]

こちらでの計算をMplusで検算する。 ides.hatenablog.com Mplus用のデータの書き出し insomnia<-read.csv("insomnia.csv",header=TRUE) insomnia<-as.data.frame(insomnia) head(insomnia) library(MplusAutomation) variable.names(insomnia) # 変数名を書…

repolrパッケージで順序ロジスティック回帰[R]

Agrestiの本で示されている例を実行してみたい。 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics Book 656) (English Edition)作者:Agresti, AlanWileyAmazon コード集のみ、サプリメントとしてネット公開されている。 …

順序ロジスティック回帰とBrant検定[R]

前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…

順序ロジスティック回帰[R]

idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…

flextableパッケージでRで作成した表をWordやPowerPointに出力する[R]

こちらを参照した。 taehoonh.me 使用するのはflextableパッケージ www.rdocumentation.org データの呼び込み library(tidyverse) dat <- mtcars[, 1:6] %>% mutate(model = rownames(mtcars)) %>% select(ncol(.), 1:(ncol(.)-1)) mtcarsの頭部分を使用する…

ガンマ分布のglm()モデリング[R]

rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…