井出草平の研究ノート

回帰分析

ロジスティック回帰におけるモデル適合度の測定

こちらの論文で挙げられている方法を検討した。 www.ncbi.nlm.nih.gov Weiss, B.A. and Dardick, W. (2016) ‘An Entropy-Based Measure for Assessing Fuzziness in Logistic Regression’, Educational and Psychological Measurement, 76(6), pp. 986–1004.…

順序ロジスティック回帰分析をStata、Mplus、Rで行う-更新[Stata][Mplus][R]

順序ロジスティック回帰分析をStata、Mplus、Rで行う 以前のエントリの更新。 ides.hatenablog.com brant検定が通らない例を使っている。 Stata brant検定が走らない場合はfindit spost13_adoからspost13_adoをインストールする必要がある。 use https://www…

最小二乗法を用いた重回帰分析の前提条件と確認方法

重回帰の前提は下記のものである。 線形性 Linearity...予測変数と従属変数の残差間に線形関係が存在する。 正規性 Normality ...残差が正規分布する。 分散均一性 homoscedasticity ...残差は一定の分散を持つと仮定する 独立性 Independence...観測変数が…

Ordinalパッケージを用いた順序ロジスティック回帰分析

quantifyinghealth.com 注:動作しないコードを書き換え、不足しているものに関して注という形で補完している。 順序ロジスティック回帰は、1つまたは複数の予測変数(数値またはカテゴリ)と順序結果の間の関係をモデルする回帰分析の一種だ。順序結果は、…

区分線形回帰モデル

www.rdocumentation.org 区分線形回帰モデルは、データセットを複数の区間に分割し、それぞれの区間で線形回帰モデルを適用する手法である。これにより、データの局所的な傾向や非線形のパターンを捉えることができる。ここではsegmentedパッケージを使用す…

mtcarsデータを用いたLasso回帰[R]

Lasso 回帰は、データに多重共線性が存在するときに、回帰モデルを適合させるために使用できる手法である。 簡単に言うと、最小2乗回帰は,残差2乗和 (RSS) を最小化する係数推定を見つける。 RSS = Σ(yi - ŷi)2 ここで Σ : 和を意味するギリシャ記号 yi: 番…

Lasso回帰モデル - R bloggers[R]

以前にStataでLasso、リッジ回帰の使い方は解説している。 ides.hatenablog.com 今回はRでの実行例について。 Lasso Regression Model with R code www.r-bloggers.com Tibshirani (1996) は、パラメータの選択と縮小のために、LASSO (Least Absolute Shrink…

順序ロジスティック回帰分析をStata、Mplus、Rで行う[Stata][Mplus][R]

この更新は更新されています。 ides.hatenablog.com brant検定がうまくいかないデータで走らせたかったので、Richard WilliamsのGologit2で使用されているデータを使用した。 解析例は下記のPDF内にあるものと基本的に同じである。 https://www.stata.com/me…

順序ロジスティック回帰[Stata]

Stataでの順序ロジスティック回帰分析の方法について。 stats.oarc.ucla.edu 順序ロジスティック回帰 順序付きロジスティック回帰の例 例 1: マーケティング・リサーチ会社が、人々がファーストフード・チェーンで注文するソーダのサイズ(S、M、L、特大)に…

repolrパッケージで順序ロジスティック回帰での結果をMplusで検算[R][Mplus]

こちらでの計算をMplusで検算する。 ides.hatenablog.com Mplus用のデータの書き出し insomnia<-read.csv("insomnia.csv",header=TRUE) insomnia<-as.data.frame(insomnia) head(insomnia) library(MplusAutomation) variable.names(insomnia) # 変数名を書…

repolrパッケージで順序ロジスティック回帰[R]

Agrestiの本で示されている例を実行してみたい。 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics Book 656) (English Edition)作者:Agresti, AlanWileyAmazon コード集のみ、サプリメントとしてネット公開されている。 …

順序ロジスティック回帰とBrant検定[R]

前回と同じく順序ロジスティック回帰モデルの話。今回はBrant検定を利用したパターン。 ides.hatenablog.com 使用するのはMASSパッケージのpolr関数。 www.rdocumentation.org データ library(MASS) data(housing) dat<- housing head(dat) Sat Infl Type Co…

順序ロジスティック回帰[R]

idreの解説より。 stats.idre.ucla.edu 後半記載されているparallel slopesの検定だが、現在はbrantパッケージでできるのではないかと思う。そのうちエントリをいれるつもり。 はじめに このページでは、Rのporrパッケージを使って順序ロジスティック回帰を…

ガンマ分布のglm()モデリング[R]

rpubs.com Kazuki Yoshidaさんによって作成されたものらしい。 farawayパッケージに含まれる半導体ウェハのデータを用いる。 library(faraway) data(wafer) plot(density(wafer$resist)) 結果は連続的なものだが、右に傾いており、常に正の値を示している。…

ガンマ分布の一般線形モデル[R]

waferデータセットの読み込み library(faraway) data(wafer) waferデータセットを添付 attach(wafer) 半導体実験におけるウエハの感度のデータだ。 https://www.rdocumentation.org/packages/faraway/versions/1.0.7/topics/wafer x1 x2 x3 x4 resist 1 - - …

因子スコアを重回帰分析の独立変数にした論文

因子スコアを独立変数にして、重回帰分析にぶち込んだ論文がいくつか存在していることを知った。 Yakubu, Idahor and Isopa(2009) https://www.researchgate.net/publication/50194274_Using_factor_scores_in_multiple_linear_regression_model_for_predict…

LaTeX形式の数式コードを書くパッケージequatiomatic[R]

中澤港さんの日記に書かれていたパッケージ(https://minato.sip21c.org/im3r/20210131.html)。 これを使うと,lmer()で使ったモデルが,そのままTeXのコードになる。LaTeXで論文を書いている人はそのまま取り込めるし,WordやLibreOfficeで論文を書いている…

タイタニック・データを用いた交互作用項のある媒介分析[Mplus]

以前のエントリーの続き。 ides.hatenablog.com 今回は交互作用を含むモデル。 独立変数(介入)と媒介変数は交互作用が生じることが多いので交互作用項を作成して分析に含めるか、連続変数の場合はセンタリング(参照)をした方がいいと言われている。タイタニ…

二次因子の信頼性係数の計算[R]

因子分析の二次因子のω係数を計測する。パッケージはsemToolsを使用する。 www.rdocumentation.org ω係数についてはこちら。 ides.hatenablog.com データ lavvanに同梱されているデータHolzingerSwineford1939を使用する。HolzingerSwineford1939を使用した…

媒介項と調整項

www.youtube.com 簡潔な説明。 媒介項(Mediator)は、因果関係があり、結果の先だったものでなければならない。 調整項(Moderator)は、因果関係の結果であってはならない。

SPSSでPROCESSマクロを使用しModel4を分析する[PROCESS][SPSS]

PROCESSはAndrew F. Hayesによって開発された媒介分析のマクロである。日本語情報は少ししか無く、英語では多く出てくるので、海外ではよく知られた分析ツールなのだと思う。PROCESSを使う媒介分析についても日本語の資料は数少ないが、海外では既に一般化し…

媒介分析の推定方法と尺度水準による推定結果の違い[Mplus]

www.statmodel.com こちらのTable 8.29のケース。 もともとの推定は下記のエントリーで、こちらは最尤推定を行うモデルである。 ides.hatenablog.com ides.hatenablog.com アプローチ2 ロバスト重み付き最小二乗法 データはスタック形式、Analysis: estimato…

2値の曝露変数、2値の媒介変数、連続変数のアウトカムの媒介分析

こちらのTable 8.22の例を解説する。コードとデータはリンク先のinpファイルを参照のこと。 www.statmodel.com 仮想データ。 モデル mは媒介変数、mxはmとxの間の相互作用項、xは2値の暴露変数である。 コード title: hypothetical potential outcome exampl…

介入-媒介変数に相互作用を伴わない2値データのアウトカム変数を用いた媒介分析[Mplus]

こちらのTable 8.8の例を解説する。コードはリンク先のinpファイルを参照のこと。 www.statmodel.com データ 大学生女性の間でヒトパピローマウイルス(HPV)のワクチン接種率を高めることを目的とした無作為化対照試験のデータを分析している。被験者は3つ…

ブートストラップを伴ったロジスティック回帰分析[Mplus]

Mplusで行うロジスティック回帰分析をブートストラップ500回の反復をするバージョン。 ides.hatenablog.com データやデータの中身については先のエントリを参照のこと。 title: logit regression for coalminers data: file =coalminer.dat; variable: names…

重回帰分析とロジステック回帰分析をRとMplusでやって比較する[Mplus][R]

データの準備 AERパッケージのCPS1985データを利用する。 library(AER) data(CPS1985) d1 <- CPS1985 caretパッケージのdummyVars関数を用いて、factor型のものをすべてダミー変数化する。 library(caret) dummy <- dummyVars(~.,data=d1) d2 <- as.data.fra…

ロジスティック回帰分析[Mplus]

Mplusでロジスティック回帰分析をする方法である。炭鉱夫の年齢と炭鉱で働くと生じる健康被害の息切れの関係を推定した例を使用する。 解説するのはこちらの例。 https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.367.3127&rep=rep1&type=pdf デ…

lavaanで行う重回帰分析[R]

lavaanなどのSEMパッケージでも回帰分析ができるとは以前から知っていたが、具体的にどうすればいいのか知らなかったので調べてみた。 シミュレーションデータ AERパッケージの中のデータCPS1985を用いる。 賃金(wage)に対する効果を見る重回帰分析をデモ…

ベイジアンロジスティック回帰分析・その3

HardinとHilbeのStata本にあるベイジアンロジスティック回帰分析の続き。今回は事前分布としてコーシー分布を使う方法についてである。 1回目エントリはこちら 2回目エントリはこちら Generalized Linear Models and Extensions: Fourth Edition作者: Jame…

ベイジアンロジスティック回帰分析・その2

HardinとHilbeのStata本にあるベイジアンロジスティック回帰分析の続き。前回のエントリはこちら Generalized Linear Models and Extensions: Fourth Edition作者: James W. Hardin,Joseph M. Hilbe出版社/メーカー: Stata Press発売日: 2018/06/28メディア:…