井出草平の研究ノート

R

交差遅延パネルモデルCross-lagged Panel Model[R]

Stataでの分析方法はこちら。 ides.hatenablog.com Mplusでの分析方法はこちら。 ides.hatenablog.com データ読み込み library(rio) nes3wave <-import("nes3wave.dta") 今回のパス図を先に表示しておこう。 コードは末尾。semPlotパッケージを用いて描画し…

psychパッケージを用いた探索的因子分析のパス図[R]

www.rdocumentation.org データ library(psych) library(GPArotation) data(bfi) d1 <- bfi[1:25] res01 <- fa(d1, nfactors = 5, fm = "ml", rotate = "promax", scores=TRUE) fa.diagram (res01, cut=0.3, simple=FALSE, sort=TRUE, digits=3) オプション …

傾向スコアによる重み付けを行うPSweightパッケージ[R]その2

こちらの続き。 ides.hatenablog.com ides.hatenablog.com cran.r-project.org こちらの4章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 4.3. 複数の処置法を用いた傾向スコアによる重み付け セクション4.2で二重処置…

傾向スコアによる重み付けを行うPSweightパッケージ[R]その1

cran.r-project.org こちらの4章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 4. NCDSデータによるケーススタディ NCDS(National Child Development Survey)データを用いて、教育達成度の時間給への因果関係を推定…

ベイジアンt検定[R]

www.sumsar.net bayes.t.test 関数 t.test関数は、4つのバージョンのt検定を実行するために使われる。ここでは、1標本と対の標本の選択肢だけを紹介する。bayes.t.testはt検定のベイジアン的な代替法を実行し、t.test関数と互換性のある関数用法を有している…

傾向スコアによる重み付けを行うPSweightパッケージの概要説明[R]

cran.r-project.org こちらの3章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 3.パッケージの概要 PSweightパッケージには、観察研究のデザインと分析に特化した2つのモジュールが含まれている。 デザインモジュール…

順序ロジスティック回帰分析をStata、Mplus、Rで行う[Stata][Mplus][R]

brant検定がうまくいかないデータで走らせたかったので、Richard WilliamsのGologit2で使用されているデータを使用した。 解析例は下記のPDF内にあるものと基本的に同じである。 https://www.stata.com/meeting/4nasug/gologit2.pdf Stata 標準誤差をロバス…

RStudio上のRを使う感覚でStataが利用できるパッケージ Statamarkdown[R][Stata]

RStudio上のRを使う感覚でStataが利用できるパッケージである。 www.ssc.wisc.edu はてなブログではチャンクオプションが表示できないため、原版と見比べながら学習してほしい。 Statamarkdown by Doug Hemken 2022-03-02 1 StataとR Markdown 1.1 はじめに …

RStanのインストールに関するメモ(2022年7月)[R]

2022年7月現在の、RにStanをインストールする手順を記載する。 現在の注意点はRStanはR4.2に対応していない、ということである。最新バージョンのRとRtoolsではRStanは動かないことに注意が必要である。 なお、Windowsでの方法であり、Macでは試していないの…

ベイズ法・ポワソンモデルを用いたクロス集計表の分析

クロス表データのベイズ分析のために使用できるいくつかの可能性があるモデルがある。 クロス表の各セルでの頻度に対するいわゆる対数線形モデル(ポアソン・モデル)。各セルのデータの比率の推定値を得るための二項モデルである。カイ二乗検定よりもさらに…

correlationパッケージ[R]

自動で相関係数を一気に計算するパッケージの一つ。サンプルデータはmtcarsを用いる。 cran.r-project.org easystats.github.io data(mtcars) head(mtcars,5) データ。 mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 1…

パス解析・直接効果・間接効果[Mplus][R]

UCLA: Statistical Consulting Groupのページから。 stats.oarc.ucla.edu UCLAではMplusのコードが書かれているが、このエントリでは、同じ分析をRのlavaanでの再現したいと思う。 Mplus パス解析はすべての変数が観測される方程式系を推定するために使用さ…

plmパッケージを用いたパネルデータ分析[R]

こちらの資料がソース。 rstudio-pubs-static.s3.amazonaws.com https://dss.princeton.edu/training/Panel101R.pdf plmパッケージ rdrr.io https://cran.r-project.org/web/packages/plm/plm.pdf データの読み込み library(foreign) Panel <- read.dta("htt…

performanceパッケージ[R]

easystats.github.io CRAN: https://cran.r-project.org/web/packages/performance/index.html rdrr.io: https://rdrr.io/cran/performance/ YouTubeでの解説(英語) www.youtube.com コードの使用法 https://rdrr.io/cran/performance/f/README.md 回帰モデ…

マハラノビス距離による外れ値の検索[R]

rpubs.com Rのマハラノビス()関数は、多次元データの外れ値を検出する簡単な手段を提供する。 例えば、身長と体重のデータフレームがあるとする。 hw <- data.frame(Height.cm=c(164, 167, 168, 169, 169, 170, 170, 170, 171, 172, 172, 173, 173, 175, 176…

データフレームの行列入れ替え[R]

data <- t(data) ameblo.jp www.marsja.se

条件を指定して行を削除する[R]

www.datasciencemadesimple.com 特定の列の特定の値のケースを削除 サンプルデータを作成 df1 = data.frame(Name = c('George','Andrea', 'Micheal','Maggie','Ravi','Xien','Jalpa'), Grade_score=c(4,6,2,9,5,7,8), Mathematics1_score=c(45,78,44,89,66,4…

データフレームにID列を追加する[R]

statisticsglobe.com サンプルデータを作る。 data <- data.frame(x1 = 15:10, x2 = letters[1:6], x3 = 4, row.names = LETTERS[16:21]) data データ。 x1 x2 x3 P 15 a 4 Q 14 b 4 R 13 c 4 S 12 d 4 T 11 e 4 U 10 f 4 例1:cbind関数とnrow関数を使って…

級内相関[R]

級内相関(intraclass correlation coefficients: ICC)連続変数における評価者内・評価者間の信頼性の指標である。 ICCにはShrout and Fleiss(1979)によるとCase1,Case2,Case3の3種類がある。 Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlati…

順序α (Ordinal Alpha)[R]

クロンバッハのαの順序尺度版。 digitalcommons.wayne.edu リッカート尺度で構成された尺度の内的一貫性・内的整合性(internal consistency)を求める際に使う価値がある方法である。 パッケージを用いた計算 ufsというパッケージ。もともとはuserfriendlysci…

まとめてT検定を行う その1[R]

こちらの方の解決法。 www.rpubs.com おそらくこのブログを書いておられる方。 https://blog.goo.ne.jp/r-de-r 同じグループ間(治療群対プラセボ群)で異なる変数(年齢、身長、体重、罹病期間、疾患など)について複数のt検定(またはウィルコクソン検定)…

for文[R]

statisticsglobe.com 例1: Rでベクトルをループする この例では、for-loopを使ってベクトル上をループする方法を説明する。 i in 1:10: iの中に1]から10までを代入していく i^2: 計算式 for(i in 1:10) { # for文ヘッド x1 <- i^2 # コードブロック print(x1…

間接法による年齢標準化と信頼区間[R]

直接法はこちら。 年齢調整罹患率(age-standardized rates)の求め方の一つ。 ides.hatenablog.com 間接法により得られる値は、正確には年齢調整罹患率ではなく、期待値と観測値の比である。 対象とする地域(例えば市町村)の年齢階級別罹患率が、比較しよ…

直接法による年齢標準化と信頼区間[R]

epitoolsパッケージを用いた直接法による年齢標準化(調整)率および「正確な」信頼区間の算出。 こちらの例から。 www.rdocumentation.org データはこの本からとられている。 Statistical Methods for Rates and Proportions (Wiley Series in Probability …

ANOVA その8 問題集

実際にやってみたところこの問題集の出来が良くないことが発覚したので注意 次の質問では、yarrrパッケージのpiratesデータフレームを使用する。 海賊の好きなpixar映画とタトゥーの数には有意な関係があるか? fav.pixarを独立変数、tattoosを従属変数とし…

ANOVA その7 ANOVAオブジェクトからの追加情報の取得

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAオブジェクトからは、多くの興味深い情報を得ることができる。1つに保存されているすべてを見るには、ANOVAオブジェクト上でコマンドを実行する。 二元配置分散分析(Two-way ANOVA)のデータをもう少し…

ANOVA その6 Type I, Type II, and Type III ANOVA

こちらの続き。 ides.hatenablog.com bookdown.org ANOVAには、タイプ1、2、3(またはタイプI、II、III)と呼ばれる3つの異なるタイプがある。これらのタイプは、分散(特に二乗和)の計算方法が異なる。データが比較的バランスのとれたもの、つまり各グルー…

ANOVA その5 二元配置分散分析(Two-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org 二元配置のANOVAを行うには、回帰モデルの式に+印で追加の独立変数を入れるだけであるこれだけです。すべてのステップは同じだ。。クリーナーとタイプの両方を独立変数とした二元配置のANOVAを行ってみよ…

ANOVA その4 一元配置分散分析(One-way ANOVA)

こちらの続き。 ides.hatenablog.com bookdown.org poopdeckのデータに一元配置のANOVA(one-way ANOVA)の実行例をする。掃除時間を従属変数に、クリーナーの種類を独立変数にしする。データをpirateplotで表すことができる。 library(yarrr) head(poopdeck) …

ANOVA その3[R]

ANOVAを行うための4つのステップ。 こちらの続き。 ides.hatenablog.com bookdown.org ここでは、Rで標準的なANOVAを行うために必要な4つのステップを紹介する。 aov()関数を使ってANOVAオブジェクトを作成する。aov()関数では、y ~ x1 + x2という形式の式で…