井出草平の研究ノート

計量

固定効果SEM・ランダム効果SEM[Stata]

SEMモデル内に観測されない異質性を組み入れることができる。これを行うために、我々は、観測されない潜在変数を使用する。 このモデルでは、潜在的なUは独立変数と相関し、従属変数に一定の効果を持つ。 . sem (U -> dg02i1, ) (U -> dg02i2, ) (U -> dg02i…

パネルデータ分析における固定効果およびランダム効果[Stata]

Sayed HossainさんのYouTube動画から。 www.youtube.com データはこちらからダウンロードできる。 https://bityl.co/E3kh 以下の手法でパネルデータを作成する。 プールドOLS回帰モデル 固定効果モデルまたはLSDVモデル ランダム効果モデル データ ここでは…

Stataにおける処置効果推定 その1[Stata]

blog.stata.com 処置効果推定量とは、観察データに基づき、ある処置が結果に及ぼす因果的な効果を推定するものである。 本日の投稿では、4つの処置効果推定量について説明する。 RA: 回帰調整 Regression adjustment IPW: 逆確率重み付け Inverse probabilit…

傾向スコアによる重み付けを行うPSweightパッケージ[R]その2

こちらの続き。 ides.hatenablog.com ides.hatenablog.com cran.r-project.org こちらの4章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 4.3. 複数の処置法を用いた傾向スコアによる重み付け セクション4.2で二重処置…

傾向スコアによる重み付けを行うPSweightパッケージ[R]その1

cran.r-project.org こちらの4章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 4. NCDSデータによるケーススタディ NCDS(National Child Development Survey)データを用いて、教育達成度の時間給への因果関係を推定…

ベイジアンt検定[R]

www.sumsar.net bayes.t.test 関数 t.test関数は、4つのバージョンのt検定を実行するために使われる。ここでは、1標本と対の標本の選択肢だけを紹介する。bayes.t.testはt検定のベイジアン的な代替法を実行し、t.test関数と互換性のある関数用法を有している…

傾向スコアによる重み付けを行うPSweightパッケージの概要説明[R]

cran.r-project.org こちらの3章の翻訳。 https://cran.r-project.org/web/packages/PSweight/vignettes/vignette.pdf 3.パッケージの概要 PSweightパッケージには、観察研究のデザインと分析に特化した2つのモジュールが含まれている。 デザインモジュール…

順序ロジスティック回帰分析をStata、Mplus、Rで行う[Stata][Mplus][R]

brant検定がうまくいかないデータで走らせたかったので、Richard WilliamsのGologit2で使用されているデータを使用した。 解析例は下記のPDF内にあるものと基本的に同じである。 https://www.stata.com/meeting/4nasug/gologit2.pdf Stata 標準誤差をロバス…

順序ロジスティック回帰[Stata]

Stataでの順序ロジスティック回帰分析の方法について。 stats.oarc.ucla.edu 順序ロジスティック回帰 順序付きロジスティック回帰の例 例 1: マーケティング・リサーチ会社が、人々がファーストフード・チェーンで注文するソーダのサイズ(S、M、L、特大)に…

RStanのインストールに関するメモ(2022年7月)[R]

2022年7月現在の、RにStanをインストールする手順を記載する。 現在の注意点はRStanはR4.2に対応していない、ということである。最新バージョンのRとRtoolsではRStanは動かないことに注意が必要である。 なお、Windowsでの方法であり、Macでは試していないの…

尤度に基づいた検定、IC指標の比較

Nylund、Asparouhov、Muthénの論文からnaive chi-square(NCS)、Lo–Mendell–Rubin、bootstrap likelihood ratio testの比較をした論文の結論部分。BLRTの優位性が示された論文として見かけることがあるが、あくまでもデータ次第であることが指摘されてことが…

相関係数の高い説明変数があれば多重共線性を考慮して片方を除くべき?

SPSSによる多変量解析オーム社Amazon 重回帰分析はとても分かりやすく有効な分析法だが、説明変数間の相関が高すぎる場合は、 パラメータの推定が不安定になるという問題点がある。 これは、説明変数間にすでに別の線型回帰関係が含まれているということであ…

多重共線性のシミュレーション

下記エントリーの続き。 ides.hatenablog.com こちらの教科書から多重共線性について Statistical Rethinking: A Bayesian Course with Examples in R and STAN (Chapman & Hall/CRC Texts in Statistical Science)作者:McElreath, RichardChapman and Hall/…

多重共線性の根本的な問題はモデルが答えようとする問題の方にありモデルそのものにはない

多重共線性があるかどうかを調べるのにVIFの値を出して4以下/10以下ならOKといった運用をしがちだが、この運用には問題がある。 第一にVIFの値で機械的にカットオフを設けることに問題があること、第二に多重共線性をモデルに求めているという根本的な誤りが…

ベイズ法・ポワソンモデルを用いたクロス集計表の分析

クロス表データのベイズ分析のために使用できるいくつかの可能性があるモデルがある。 クロス表の各セルでの頻度に対するいわゆる対数線形モデル(ポアソン・モデル)。各セルのデータの比率の推定値を得るための二項モデルである。カイ二乗検定よりもさらに…

correlationパッケージ[R]

自動で相関係数を一気に計算するパッケージの一つ。サンプルデータはmtcarsを用いる。 cran.r-project.org easystats.github.io data(mtcars) head(mtcars,5) データ。 mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 1…

R二乗は役に立たないのか?

カーネギーメロン大学のCosma Shalizi氏の「R二乗値は何の役にも立たない」関連。 ides.hatenablog.com バージニア大学図書館のクレイ・フォード氏によるシミュレーションをみてみよう。 data.library.virginia.edu 2015年10月16日(木)、不信感を抱いた学…

パス解析・直接効果・間接効果[Mplus][R]

UCLA: Statistical Consulting Groupのページから。 stats.oarc.ucla.edu UCLAではMplusのコードが書かれているが、このエントリでは、同じ分析をRのlavaanでの再現したいと思う。 Mplus パス解析はすべての変数が観測される方程式系を推定するために使用さ…

plmパッケージを用いたパネルデータ分析[R]

こちらの資料がソース。 rstudio-pubs-static.s3.amazonaws.com https://dss.princeton.edu/training/Panel101R.pdf plmパッケージ rdrr.io https://cran.r-project.org/web/packages/plm/plm.pdf データの読み込み library(foreign) Panel <- read.dta("htt…

R二乗値は何の役にも立たない

カーネギーメロン大学のCosma Shalizi氏による資料から。 https://www.stat.cmu.edu/~cshalizi/ こちらの3節の翻訳である。 https://www.stat.cmu.edu/~cshalizi/mreg/15/lectures/10/lecture-10.pdf 3. R二乗 R二乗は線形モデルを最小二乗法で推定する場合…

performanceパッケージ[R]

easystats.github.io CRAN: https://cran.r-project.org/web/packages/performance/index.html rdrr.io: https://rdrr.io/cran/performance/ YouTubeでの解説(英語) www.youtube.com コードの使用法 https://rdrr.io/cran/performance/f/README.md 回帰モデ…

マハラノビス距離による外れ値の検索[R]

rpubs.com Rのマハラノビス()関数は、多次元データの外れ値を検出する簡単な手段を提供する。 例えば、身長と体重のデータフレームがあるとする。 hw <- data.frame(Height.cm=c(164, 167, 168, 169, 169, 170, 170, 170, 171, 172, 172, 173, 173, 175, 176…

データフレームの行列入れ替え[R]

data <- t(data) ameblo.jp www.marsja.se

条件を指定して行を削除する[R]

www.datasciencemadesimple.com 特定の列の特定の値のケースを削除 サンプルデータを作成 df1 = data.frame(Name = c('George','Andrea', 'Micheal','Maggie','Ravi','Xien','Jalpa'), Grade_score=c(4,6,2,9,5,7,8), Mathematics1_score=c(45,78,44,89,66,4…

データフレームにID列を追加する[R]

statisticsglobe.com サンプルデータを作る。 data <- data.frame(x1 = 15:10, x2 = letters[1:6], x3 = 4, row.names = LETTERS[16:21]) data データ。 x1 x2 x3 P 15 a 4 Q 14 b 4 R 13 c 4 S 12 d 4 T 11 e 4 U 10 f 4 例1:cbind関数とnrow関数を使って…

級内相関[R]

級内相関(intraclass correlation coefficients: ICC)連続変数における評価者内・評価者間の信頼性の指標である。 ICCにはShrout and Fleiss(1979)によるとCase1,Case2,Case3の3種類がある。 Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlati…

順序α (Ordinal Alpha)[R]

クロンバッハのαの順序尺度版。 digitalcommons.wayne.edu リッカート尺度で構成された尺度の内的一貫性・内的整合性(internal consistency)を求める際に使う価値がある方法である。 パッケージを用いた計算 ufsというパッケージ。もともとはuserfriendlysci…

まとめてT検定を行う その1[R]

こちらの方の解決法。 www.rpubs.com おそらくこのブログを書いておられる方。 https://blog.goo.ne.jp/r-de-r 同じグループ間(治療群対プラセボ群)で異なる変数(年齢、身長、体重、罹病期間、疾患など)について複数のt検定(またはウィルコクソン検定)…

リッカート尺度の問題点とサーストーンスケーリングの復権

下記の論文から。 www.cambridge.org 「リッカートから75年:サーストンは正しかった!」 DRASGOWとCHERNYSHENKOとSTARKらのの論文。 サーストンの計測 1920年代後半、ルイス・サーストンは一連の注目すべき論文の中で、「態度は測定できる」(1928)と主張…

for文[R]

statisticsglobe.com 例1: Rでベクトルをループする この例では、for-loopを使ってベクトル上をループする方法を説明する。 i in 1:10: iの中に1]から10までを代入していく i^2: 計算式 for(i in 1:10) { # for文ヘッド x1 <- i^2 # コードブロック print(x1…