R

ソマーズのD[R]

SatataでソマーズのDの出力の方法を以前のエントリで書いたのでRでの出し方も書いておこうと思う。 ryoureadyパッケージ ryoureadyパッケージを使うのが最も楽なのではないかと思う。 ord.somers.d関数を利用する。データは「データ作成」以降のスクリプトに…

オッズ比のバリエーション

オッズ比にいくつかの計算方法があるということには少し前から気になっていた。といっても僕の勉強する範囲の研究では古典的なオッズ比以外みたことがなく、何のことかよくわからなかった。 Rのepitoolsパッケージでは4種類のオッズ比が出力できる。何が出力…

2値と連続変数の関連を示す指標

ROC曲線下の面積の続きである。 医学分野では連続変数とカテゴリカル変数の関連を表現する指標としてROC曲線下の面積が利用される理由はよく知らないのだが、他にも使える指標があるのではないかと思い、候補を並べてみた。 勉強をしているとROC曲線下の面積…

ROC曲線のサンプルサイズの推定

ROC曲線のサンプルサイズの推定について。質問を受けたので推定方法を書いておこう。 pROCパッケージのpower.roc.test関数を利用する。 aucは目標とするACUの値。任意の値である。 sig.levelは有意水準。デフォルトでは5%となっていて書かなくてもいいし、変…

ROC曲線下の面積

ROC曲線のAUC(Area Under the Curve)はAUCは0から1までの値をとる。値が1だと完全に判別ができており、ランダムであるとき、AUC = 0.5となる。 医学で尺度(連続変数)と診断(2値)の一致度、つまり併存妥当性を表すときに使うらしい。論文でもよく使われるそ…

尺度水準に適した相関係数とシミュレーション

今回は相関係数の比較をする。 通常、相関係数というとピアソンの積率相関係数のことを指す。 ピアソンの積率相関係数は連続変数と連続変数の関連を調べるために使用されるが、連続変数以外でも下記のような相関係数がある。 ピアソンの積率相関係数: 連続変…

分位点でデータをリコードする

以前にもシミュレーションで使っている手技たが一度まとめておこうと思う。 55点が平均で標準偏差15程度のテストっぽい仮想データを作成する。 set.seed(123) # 乱数シードの固定 d1 <- data.frame(rnorm(100, mean=55, sd= 15)) # 100個のデータの作成 d1 <…

全変数の関連を楽に把握する試み(ただし道半ば)

二次分析をする際に、データのどこが使える部分なのかわからない時がしばしばある。そういう時に、褒められた方法とは言えないかもしれないが、全変数の関連を把握できると分析のとっかかりになることがある。 ということで、いかに楽に把握をするかというこ…

相関係数を指定した乱数を作る

相関係数のデモをirisデータで作っていてうまくいかず、サンプルデータを作成した時の副産物。 今回は数学と科学のテスト点のサンプルデータを作った。 使用するのはrmvnormであって多次元正規分布を作成する機能である。パッケージは不要であるmvtnormパッ…

2値カテゴリカル因子分析と潜在クラス分析のシミュレーション, その2

前回のエントリ、2値のカテゴリカル因子分析と潜在クラス分析の結果の差異で因子分析と潜在クラス分析のグループ分けの違いを分析した。 今回は以前のエントリで使用した児童向けウェクスラー式知能検査(Wechsler Intelligence Scale for Children; WISC)…

2値のカテゴリカル因子分析と潜在クラス分析の結果の差異

2値のカテゴリカル因子分析と2値の潜在クラス分析の結果どのように違うのかをシミュレーションしてみたい。因子分析も潜在クラス分析もグループ分けをする手技である。しかし、両者はグループの分け方が異なる。因子分析が変数の近さでグループを作るのに…

因子分析とカテゴリカル因子分析の結果はとのくらい異なるか

ノーマルな因子分析は連続変数を用いる。その拡張としてカテゴリカル変数でも因子分析は可能である。今回は、連続変数で推定した結果とカテゴリカル因子分析の推定はどのくらい異なるのかをシミュレーションしてみたい。 大前提としてカテゴリカル変数といっ…

Rで相関プロットを描く

相関分析を視覚的に認識するために、相関プロットは有効である。特に、二次分析の際などに威力を発揮するかもしれない。二次分析は仮説があってそれを検証すために調査を作れるわけではないので、どの部分を分析するか、総当たりで検証することもあるからだ…

Rで共変量プロットを描く

Rで共変量プロットを描く。 library(AER) data(CPS1985) fit <- lm(formula = wage ~ education + age + gender + occupation + union, data = CPS1985) summary(fit) 結果の表示。 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -1.8654…

コマンドラインにふりながを打つ

CUI、コマンドライン、など呼び方はいくつかあるが、統計処理をする際にコマンドを打つ作業が求められることがある。統計学の習得をする際にコマンドを打つという作業でつまづく人は多いらしい。 計量の研究者でもSPSSやAMOSだったらできるが、RやMplusは無…

Rでステップワイズ回帰

ステップワイズ回帰とは説明する変数(独立変数)に何を入れれば、最も説明力が高いモデルが作れるかを自動的に考えてくれるという方法だ。日本語ではSASのJMPのページの解説がよさそうに思えた。 www.jmp.com PCで統計パッケージを使って行えば、自動的に最も…

カテゴリカル因子分析

追記: 019/09/18 以前、psychパッケージのfa.poly functionでカテゴリカル因子分析を書いていたが、非推奨の方法だったようだ。psychパッケージの仕様書には次のように書いてある。 fa.poly Deprecated Exploratory Factor analysis functions. Please use …

因子分析に関するメモ

落穂拾い的なエントリ。 以前のエントリー(http://ides.hatenablog.com/entry/2019/04/08/171145)で取り上げた清水和秋「因子分析的研究におけるmisuseとartifact」の続き部分である。 kansai-u.repo.nii.ac.jp 平行分析もMAPも主成分を使用 Horn(1965)の…

Rで平行分析

Mplusでの平行分析の実行の仕方は以前に書いたが、Rでも実行できる。 今回もbfiデータの1~25列目を使用する(参考: http://ides.hatenablog.com/entry/2019/03/19/093726)。 library("psych") data(bfi) d1<-bfi[1:25] 平行分析は次のように指定する。 fa.par…

MAP(最小平均偏相関)

探索的因子分析において因子数を決定する基準として使われるMAPについて。 MAP:Minimum Average Partial correlationであり、日本語だと最小平均偏相関になる。 Velicerによつて開発された方法である。 link.springer.com 因子数を決める基準はどれが適切か…

Rで因子分析 基礎

この原稿は統計学勉強会のためにかかれたもので、学校で習うあたりまでの簡単な解説である。 因子分析とは (探索的)因子分析とは、観測できる変数から観察できない因子(潜在変数)を見出す探索し発見する方法である。このように説明してもよくわからないの…

Rで基礎分析(クロス集計表、相関係数、分散分析)

このエントリーは統計学勉強会用の下書きである。 ここでは、Rでクロス集計表、相関係数、分散分析をする方法を述べる。 どんな難しい分析をするときにも、最初は記述統計、そして、この3つの分析をして、多変量解析に進む。 その意味で、基礎分析と言って…

Rのlavaanパッケージでパス解析を行う

SEMはMplusを使ってきたので、lavaanパッケージについてはほとんど知らないのだが、使う必要性が出てきたので、勉強がてらにメモ。 いわゆるパス解析をこのエントリーではやってみようと思う。 lavaanパッケージを使用するのでインストールをする。 lavaanパ…

Rでオッズ比と調整済み残差を出す

2x2のクロス集計表の場合はオッズ比と調整済み標準化残差は似たような統計量になる。どちらが好まれるかは分野によって異なるので、適宜、好まれる方を使用するのがよいと思う。社会学ではそれほど見かけることはないが使用されるはずである。オッズ比はなぜ…

Rで回帰分析のモデルを並べる方法

回帰分析のモデル比較をする表をExcelで作らずRでキレイに整形できるという話を聞いたので少し調べてみた。Rのstargazerパッケージ、texregパッケージできれいに整形できるらしい。いずれも、TeX、HTML、テキストの3種類に出力できる能力がある。 下準備と…

RのpoLCAパッケージで潜在クラス分析を行う

Rので潜在クラス分析を行う。 Rで潜在クラス分析ができるパッケージは3つある。 library(e1071) https://cran.r-project.org/package=e1071 library(poLCA) https://cran.r-project.org/package=poLCA library(randomLCA) https://cran.r-project.org/web/pa…