回帰分析
Benjamini-Hochberg法の重回帰での意義 重回帰分析においてBenjamini-Hochberg法(BH法)を適用する主な意義は、多重検定問題に対処することである。重回帰分析では複数の説明変数の係数に対して同時に仮説検定を行うため、偽陽性(第一種の過誤)が増加する…
robustbaseパッケージではMM推定、S推定、Koller & Stahel (2017)、Koller (2012)による補正設定を用いたMM推定が可能である。 www.rdocumentation.org MM推定 MM推定はYohai(1987)によって提案された方法である。MM推定はM推定で得られた残差標準偏差を最小…
以前に書いたロバスト推定の方法。こちらにP値の出し方を書いていなかったので、補足。 ides.hatenablog.com 通常の重回帰分析 mod <- lm(wage ~ gender + age + education, data = CPS1985) summary(mod) 結果: Coefficients: Estimate Std. Error t value…
CPS1985データを使い、wageを従属変数、genderとageと独立変数とした重回帰分析を行う。 RStudioでの実行。R.4.3.3+Stools4.3を使用。 data { int<lower=0> N; // サンプルサイズ int<lower=0, upper=1> X_1[N]; // 独立変数(性別、0: 男性、1: 女性) vector[N] X_2; // 独立変数: 年</lower=0,></lower=0>…
こちらの論文で挙げられている方法を検討した。 www.ncbi.nlm.nih.gov Weiss, B.A. and Dardick, W. (2016) ‘An Entropy-Based Measure for Assessing Fuzziness in Logistic Regression’, Educational and Psychological Measurement, 76(6), pp. 986–1004.…
順序ロジスティック回帰分析をStata、Mplus、Rで行う 以前のエントリの更新。 ides.hatenablog.com brant検定が通らない例を使っている。 Stata brant検定が走らない場合はfindit spost13_adoからspost13_adoをインストールする必要がある。 use https://www…
重回帰の前提は下記のものである。 線形性 Linearity...予測変数と従属変数の残差間に線形関係が存在する。 正規性 Normality ...残差が正規分布する。 分散均一性 homoscedasticity ...残差は一定の分散を持つと仮定する 独立性 Independence...観測変数が…
quantifyinghealth.com 注:動作しないコードを書き換え、不足しているものに関して注という形で補完している。 順序ロジスティック回帰は、1つまたは複数の予測変数(数値またはカテゴリ)と順序結果の間の関係をモデルする回帰分析の一種だ。順序結果は、…
www.rdocumentation.org 区分線形回帰モデルは、データセットを複数の区間に分割し、それぞれの区間で線形回帰モデルを適用する手法である。これにより、データの局所的な傾向や非線形のパターンを捉えることができる。ここではsegmentedパッケージを使用す…
Lasso 回帰は、データに多重共線性が存在するときに、回帰モデルを適合させるために使用できる手法である。 簡単に言うと、最小2乗回帰は,残差2乗和 (RSS) を最小化する係数推定を見つける。 RSS = Σ(yi - ŷi)2 ここで Σ : 和を意味するギリシャ記号 yi: 番…
以前にStataでLasso、リッジ回帰の使い方は解説している。 ides.hatenablog.com 今回はRでの実行例について。 Lasso Regression Model with R code www.r-bloggers.com Tibshirani (1996) は、パラメータの選択と縮小のために、LASSO (Least Absolute Shrink…
この更新は更新されています。 ides.hatenablog.com brant検定がうまくいかないデータで走らせたかったので、Richard WilliamsのGologit2で使用されているデータを使用した。 解析例は下記のPDF内にあるものと基本的に同じである。 https://www.stata.com/me…
Stataでの順序ロジスティック回帰分析の方法について。 stats.oarc.ucla.edu 順序ロジスティック回帰 順序付きロジスティック回帰の例 例 1: マーケティング・リサーチ会社が、人々がファーストフード・チェーンで注文するソーダのサイズ(S、M、L、特大)に…
こちらでの計算をMplusで検算する。 ides.hatenablog.com Mplus用のデータの書き出し insomnia<-read.csv("insomnia.csv",header=TRUE) insomnia<-as.data.frame(insomnia) head(insomnia) library(MplusAutomation) variable.names(insomnia) # 変数名を書…
Agrestiの本で示されている例を実行してみたい。 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics Book 656) (English Edition)作者:Agresti, AlanWileyAmazon コード集のみ、サプリメントとしてネット公開されている。 …
前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…
idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…
rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…
waferデータセットの読み込み library(faraway) data(wafer) waferデータセットを添付 attach(wafer) 半導体実験におけるウエハの感度のデータだ。 https://www.rdocumentation.org/packages/faraway/versions/1.0.7/topics/wafer x1 x2 x3 x4 resist 1 - - …
因子スコアを独立変数にして、重回帰分析にぶち込んだ論文がいくつか存在していることを知った。 Yakubu, Idahor and Isopa(2009) https://www.researchgate.net/publication/50194274_Using_factor_scores_in_multiple_linear_regression_model_for_predict…
中澤港さんの日記に書かれていたパッケージ(https://minato.sip21c.org/im3r/20210131.html)。 これを使うと,lmer()で使ったモデルが,そのままTeXのコードになる。LaTeXで論文を書いている人はそのまま取り込めるし,WordやLibreOfficeで論文を書いている…
以前のエントリーの続き。 ides.hatenablog.com 今回は交互作用を含むモデル。 独立変数(介入)と媒介変数は交互作用が生じることが多いので交互作用項を作成して分析に含めるか、連続変数の場合はセンタリング(参照)をした方がいいと言われている。タイタニ…
因子分析の二次因子のω係数を計測する。パッケージはsemToolsを使用する。 www.rdocumentation.org ω係数についてはこちら。 ides.hatenablog.com データ lavvanに同梱されているデータHolzingerSwineford1939を使用する。HolzingerSwineford1939を使用した…
www.youtube.com 簡潔な説明。 媒介項(Mediator)は、因果関係があり、結果の先だったものでなければならない。 調整項(Moderator)は、因果関係の結果であってはならない。
PROCESSはAndrew F. Hayesによって開発された媒介分析のマクロである。日本語情報は少ししか無く、英語では多く出てくるので、海外ではよく知られた分析ツールなのだと思う。PROCESSを使う媒介分析についても日本語の資料は数少ないが、海外では既に一般化し…
www.statmodel.com こちらのTable 8.29のケース。 もともとの推定は下記のエントリーで、こちらは最尤推定を行うモデルである。 ides.hatenablog.com ides.hatenablog.com アプローチ2 ロバスト重み付き最小二乗法 データはスタック形式、Analysis: estimato…
こちらのTable 8.22の例を解説する。コードとデータはリンク先のinpファイルを参照のこと。 www.statmodel.com 仮想データ。 モデル mは媒介変数、mxはmとxの間の相互作用項、xは2値の暴露変数である。 コード title: hypothetical potential outcome exampl…
こちらのTable 8.8の例を解説する。コードはリンク先のinpファイルを参照のこと。 www.statmodel.com データ 大学生女性の間でヒトパピローマウイルス(HPV)のワクチン接種率を高めることを目的とした無作為化対照試験のデータを分析している。被験者は3つ…
Mplusで行うロジスティック回帰分析をブートストラップ500回の反復をするバージョン。 ides.hatenablog.com データやデータの中身については先のエントリを参照のこと。 title: logit regression for coalminers data: file =coalminer.dat; variable: names…
データの準備 AERパッケージのCPS1985データを利用する。 library(AER) data(CPS1985) d1 <- CPS1985 caretパッケージのdummyVars関数を用いて、factor型のものをすべてダミー変数化する。 library(caret) dummy <- dummyVars(~.,data=d1) d2 <- as.data.fra…