井出草平の研究ノート

計量

間接法による年齢標準化と信頼区間[R]

直接法はこちら。 年齢調整罹患率(age-standardized rates)の求め方の一つ。 ides.hatenablog.com 間接法により得られる値は、正確には年齢調整罹患率ではなく、期待値と観測値の比である。 対象とする地域(例えば市町村)の年齢階級別罹患率が、比較しよ…

直接法による年齢標準化と信頼区間[R]

epitoolsパッケージを用いた直接法による年齢標準化(調整)率および「正確な」信頼区間の算出。 こちらの例から。 www.rdocumentation.org データはこの本からとられている。 Statistical Methods for Rates and Proportions (Wiley Series in Probability …

ANOVA その8 問題集

実際にやってみたところこの問題集の出来が良くないことが発覚したので注意 次の質問では、yarrrパッケージのpiratesデータフレームを使用する。 海賊の好きなpixar映画とタトゥーの数には有意な関係があるか? fav.pixarを独立変数、tattoosを従属変数とし…

ANOVA その7 ANOVAオブジェクトからの追加情報の取得

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAオブジェクトからは、多くの興味深い情報を得ることができる。1つに保存されているすべてを見るには、ANOVAオブジェクト上でコマンドを実行する。 二元配置分散分析(Two-way ANOVA)のデータをもう少し…

ANOVA その6 Type I, Type II, and Type III ANOVA

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAには、タイプ1、2、3(またはタイプI、II、III)と呼ばれる3つの異なるタイプがある。これらのタイプは、分散(特に二乗和)の計算方法が異なる。データが比較的バランスのとれたもの、つまり各グルー…

ANOVA その5 二元配置分散分析(Two-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org 二元配置のANOVAを行うには、回帰モデルの式に+印で追加の独立変数を入れるだけであるこれだけです。すべてのステップは同じだ。。クリーナーとタイプの両方を独立変数とした二元配置のANOVAを行ってみよ…

ANOVA その4 一元配置分散分析(One-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org poopdeckのデータに一元配置のANOVA(one-way ANOVA)の実行例をする。掃除時間を従属変数に、クリーナーの種類を独立変数にしする。データをpirateplotで表すことができる。 library(yarrr) head(poopdeck) …

ANOVA その3[R]

ANOVAを行うための4つのステップ。 こちらの続き。 ides.hatenablog.com bookdown.org ここでは、Rで標準的なANOVAを行うために必要な4つのステップを紹介する。 aov()関数を使ってANOVAオブジェクトを作成する。aov()関数では、y ~ x1 + x2という形式の式で…

ANOVA その2[R]

こちらの続き。 ides.hatenablog.com bookdown.org 完全要因被験者間分散分析(Full-factorial between-subjects ANOVA) 分散分析(ANOVA)には、分析しているデータの種類に応じて多くの種類がある。ANOVAには非常に多くの種類があり、1つのタイプと別のタイ…

ROC曲線と正診率[R]

ROC(Receiver Operating Characteristic)曲線は、X軸に偽陽性率、Y軸に真陽性率をとって描かれる。 ROCは、すべての陽性を識別するために、どれだけの間違いを犯しているかがわかる。 今回は正診率について。 ROC曲線下の面積およびブートストラップによる…

感度・特異度の計算[R]

2×2の分割表における感度・特異度その他、もろもろの計算方法について。 epiRパッケージを利用する。 www.rdocumentation.org 例1 Scott et al. (2008)表1より。新しい診断テストが1586人の患者に試行された。疾患陽性の744人の患者のうち、670人が検査陽性…

repolrパッケージで順序ロジスティック回帰での結果をMplusで検算[R][Mplus]

こちらでの計算をMplusで検算する。 ides.hatenablog.com Mplus用のデータの書き出し insomnia<-read.csv("insomnia.csv",header=TRUE) insomnia<-as.data.frame(insomnia) head(insomnia) library(MplusAutomation) variable.names(insomnia) # 変数名を書…

repolrパッケージで順序ロジスティック回帰[R]

Agrestiの本で示されている例を実行してみたい。 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics Book 656) (English Edition)作者:Agresti, AlanWileyAmazon コード集のみ、サプリメントとしてネット公開されている。 …

順序ロジスティック回帰とBrant検定[R]

前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…

順序ロジスティック回帰[R]

idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…

収束妥当性

A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)作者:Hair Jr., Dr. Joe,Hult, G. Tomas M.,Ringle, Dr. Christian M.,Sarstedt, MarkoSAGE Publications, IncAmazon A Primer on Partial Least Squares Structural Equation Mod…

flextableパッケージでRで作成した表をWordやPowerPointに出力する[R]

こちらを参照した。 taehoonh.me 使用するのはflextableパッケージ www.rdocumentation.org データの呼び込み library(tidyverse) dat <- mtcars[, 1:6] %>% mutate(model = rownames(mtcars)) %>% select(ncol(.), 1:(ncol(.)-1)) mtcarsの頭部分を使用する…

WLSMV を用いた測定の不変性の計算[Mplus]

Mplusで推定にWLSMV(adjusted diagonally weighted least squares)を使った測定の不変性の確認の方法について。 最尤法は正規分布と連続変数という2つの強力な仮定をすることから、順序尺度や正規分布にならないものの測定の不変性について確認する場合には…

LatentGOLDで潜在クラス分析[LatentGOLD]

日本語では潜在クラス分析と呼ぶことが多いが、他の潜在クラスモデルと区別するために、潜在クラス・クラスター・モデル(Latent Class Cluster Model)とも言われる。 データ RのpoLCAパッケージからvalueデータを使用する。 library("poLCA") data("values",…

ガンマ分布のglm()モデリング[R]

rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…

ガンマ分布の一般線形モデル[R]

waferデータセットの読み込み library(faraway) data(wafer) waferデータセットを添付 attach(wafer) 半導体実験におけるウエハの感度のデータだ。 https://www.rdocumentation.org/packages/faraway/versions/1.0.7/topics/wafer x1 x2 x3 x4 resist 1 - - …

ANOVA その1[R]

bookdown.org Nathaniel D. PhillipsさんのR解説から。 第14章 ANOVA 図14.1: メナージュ・ア・トロワMenage a troisのワイン - 三元配置分散分析に最適な組み合わせ 前章では、1標本および2標本の仮説検定を取り上げた。これらの検定では、1つのグループを…

factor型やcharacter型の"NA"をNA(欠損値)にする方法[R]

少し困ったのでメモ。 dplyr.tidyverse.org dplyrパッケージを使うと楽なようだ。 na_if(data, "NA") "NA"→NAになり、欠損値にすることができる。

クラスター分析で用いられていたユークリッド距離はその場しのぎの非類似度測定

ちょっと面白い言い回しを発見。 Structural Equation Modeling: Applications Using Mplus (Wiley Series in Probability and Statistics Book 9) (English Edition)作者:Wang, Jichuan,Wang, XiaoqianWileyAmazon 従来のクラスター分析で用いられていたユ…

ベイジアンCFAモデル

Structural Equation Modeling: Applications Using Mplus (Wiley Series in Probability and Statistics Book 9) (English Edition)作者:Wang, Jichuan,Wang, XiaoqianWileyAmazon 2.9章から。 従来のCFAモデルでは、各指標・項目は理論的に仮定された1つの…

Rでのリコード[R]

頻繁に使うのに忘れてしまうコードなので、メモ。 サンプルデータの呼び出し library(AER) #パッケージの呼び出し。CPS1985というデータがこのパッケージに含まれている data(CPS1985) #CPS1985データの行頭のみ表示 memiscパッケージ library(memisc) CPS19…

MTMM matrix: Multitrait-Multimethod matrix

conjointly.com William M.K. Trochimさんによる解説から。 MTMM matrixとは? Multitraitit-Multimethod Matrix(以下、MTMM)は、研究における一連の測定値の構成概念の妥当性を評価するための手法である。1959年にCampbellとFiskeによって開発された(Cam…

Geiser,2020, Longitudinal Structural Equation Modeling with Mplus A Latent State-Trait Perspective

Longitudinal Structural Equation Modeling with Mplus: A Latent State-Trait Perspective (Methodology in the Social Sciences)作者:Geiser, Christian発売日: 2020/11/04メディア: ペーパーバック ほとんどの最新の縦断的手法は、ある時点での個人差と…

lavaanを用いてWLSMVによる測定の不変性を計算する[R]

WLSMV(adjusted diagonally weighted least squares)での測定の不変性の方法が確立しているらしい。 https://www.tandfonline.com/doi/abs/10.1080/10705511.2019.1602776 最尤法での測定の不変性についてはこちらを参照のこと。 ides.hatenablog.com サンプ…

正規性の検定

日本語でも解説が多く、有名な手法なので、やり方だけを記す。 データはirisを用いる。 ガクの長さのデータが正規分布が仮定できるかを検定する。 data(iris) head(iris$Sepal.Length) データ。 [1] 5.1 4.9 4.7 4.6 5.0 5.4 シャピロ・ウィルク検定 (Shapir…