計量

texregの結果をRstudioで取り込むには

今回は2年以上前のエントリの続きである。 ides.hatenablog.com 一番下の節で紹介しているtexregパッケージを実戦で使ってみたのだが意外に使いにくい。 確かに、HTML形式で綺麗な回帰分析は作れるが、それをRstudioに張り付けてレポートにすること、つまり…

アドヒアランスの指標であるMPRとPDCを計算するパッケージ[Stata]

The Stata Journalを読んでいたらMPRとPDCを計算するパッケージの紹介があったので、こちらで紹介しておこう。 https://journals.sagepub.com/doi/pdf/10.1177/1536867X19893625 http://www.lindenconsulting.org/stats.html NPRとは薬剤保持率(medication …

潜在プロファイル分析の標準書式での書き換え

mclustパッケージを使った潜在プロファイル分析のエントリではパイプ演算子によるコードを使用していた。 ides.hatenablog.com パイプを使わずにRの標準書式での記述を示しておきたい。 参考までに、パイプ演算子での表記も併記しておく。 まず、young_peopl…

SPSS、SAS、StataのデータをRでインポート、エクスポートをする

SPSS、SAS、StataのデータをRでインポート、エクスポートをするhavenパッケージの紹介である。 havenパッケージはtidyverseを構成するパッケージの一つである。 他の統計パッケージのデータを読み込む有名なパッケージはforeignだが、RStudioブログによると…

Rのmclustパッケージで潜在プロファイル分析

今回はRのmclustパッケージで潜在プロファイル分析を行う方法について解説したい。 潜在クラス分析はカテゴリカル変数、潜在プロファイル分析は(基本的には)連続変数という違いはあるものの、ケースごとのパターンからクラス分けをするのは同じである。 使い…

RからMplusを使う Rですべて完結させる

RからMplusが使えるようになるMplusAutomationパッケージについてのエントリ2つ目。 前回はデータをMplus形式に変換する方法について解説した。 ides.hatenablog.com 今回も下記の条件で書いている。 RStudioを使っている ファルダパスに日本語が混じってい…

RからMplusを使う ファイル変換編

RからMplusが使えるようになるMplusAutomationパッケージというものがある。 cran.r-project.org 有用な関数が複数含まれているので使い方がいくつかあるが、今回はRを使ってMplusのデータとコードの一部を作る方法を紹介しよう。 RStudioを利用する RとMplu…

1台のパソコンで異なったバージョンのMplusを使うには

今日は小技の紹介。 1台のパソコンで異なったバージョンのMplusを使うにはどうしたらよいか、という話である。 このようなことを試みた人はあまりいないかもしれないが、Mplusの異なったバージョンを同じPCにインストールしてもうまく使えない。 今回のはそ…

Stata LCA プラグインを使用した潜在クラス分析 導入偏

Stata15から標準機能で潜在クラス分析ができるようになっている。 ただ、基本的な機能しかないため、Stataの標準機能の潜在クラス分析は現在のところ実用に耐えられない。そこで、面倒な作業が必要になるが、Lanzaらが作成したStata LCA プラグインを使わざ…

99ルール - ブートストラップは99回反復しろ!

今回は潜在クラス分析のBLRTのエントリの積み残しである。 RandomLCAパッケージを用いた潜在クラス分析とBLRT[R] 先のエントリーでは修正値を変更すればブートストラップの反復回数は連動して変えられるのでは?と書いていたが、修正値は1のままで、一般的…

poLCAでデータ加工をしてRandomLCAでBLRTの計算をする[R]

私たちが使い慣れているデータ(行にケース、列に変数という形式のもの)を使ってRでブートストラップ尤度比検定(Bootstrapped Likelihood Ratio Test)を計算する方法についてのエントリである。 poLCAには残念ながらBLRTの機能がないので、poLCAのpredcell関…

RandomLCAパッケージを用いた潜在クラス分析とBLRT[R]

Rで潜在クラス分析をするパッケージとしてはpoLCAが有名だが、RandomLCAでも潜在クラス分析ができる。 poLCAではブートストラップ尤度比検定(Bootstrapped Likelihood Ratio Test: BLRT)ができないが、RandomLCAではできるらしい。 cran.r-project.org Rando…

潜在クラス分析のエントロピーの計算[R]

RのpoLCAパッケージで潜在クラス分析のエントロピーを計算してみたい。 相対的エントロピーと絶対的エントロピー エントロピーという指標はMplusユーザーにとってはお馴染みのものである。 Mplusで出力されるのは正確に言うと、相対的エントロピー(Relative …

共変量を伴った潜在クラス分析[R]

Rで共変量を伴った潜在クラス分析を行ってみたい。 パッケージはpoLCAを使う。 poLCAパッケージを利用した潜在クラス分析は以前にエントリしている。 RのpoLCAパッケージで潜在クラス分析を行う 共変量とは何かというのは、以前にMplusでの方法をエントリし…

潜在クラス分析の応答確率の棒グラフ[Stata]

Stataでは潜在クラス分析の応答確率の棒グラフが描ける。棒グラフというのは今まで見たことがなかった。不要な気もしないでもないが、説明するときにわかりやすいのかもしれない。 使用するのはmarginsとmarginsplotである。説明によると条件付き応答確率の…

潜在クラス分析[Stata]

Stataで潜在クラス分析ができるのでやってみた。 Stata15から標準機能で利用できるらしい。 Lanzaらのプラグインを使えばStata11から利用可能である。 www.methodology.psu.edu Stataの標準機能だと機能が足りないように思うので、Lanzaらのパッケージを結局…

有病率の計算[R]

こちらのエントリでStataで行ったことをRでもやってみたい。 有病率の計算はprevalenceパッケージを用いる。 prevalence.cbra.be prevalenceパッケージはベイズ統計学の計算にJAGSとrjagsを利用する。 JAGSを使ったことがない場合には、インストールが必要で…

有病率の計算[Stata]

疫学調査で有病率を出す方法である。専門用語では母比率の推定という。日本語で母比率と言うとピンとこないが、英語だとpopulation rateなので、こちらの方が直感的に理解できるはずである。 Stataで有病率を推定する Stataではcii propコマンドを使用する。…

ソマーズのD[R]

SatataでソマーズのDの出力の方法を以前のエントリで書いたのでRでの出し方も書いておこうと思う。 ryoureadyパッケージ ryoureadyパッケージを使うのが最も楽なのではないかと思う。 ord.somers.d関数を利用する。データは「データ作成」以降のスクリプトに…

オッズ比のバリエーション

オッズ比にいくつかの計算方法があるということには少し前から気になっていた。といっても僕の勉強する範囲の研究では古典的なオッズ比以外みたことがなく、何のことかよくわからなかった。 Rのepitoolsパッケージでは4種類のオッズ比が出力できる。何が出力…

相関係数の比較[Stata]

Stataでも相関係数の計算をしてみた。こちらのエントリ尺度水準に適した相関係数とシミュレーションをStataで行ったバージョンである。 データはこちらからダウンロード、もしくは下部にRでの作成方法を掲載しているので、そのままRで走らせると、dta形式の…

2値と連続変数の関連を示す指標

ROC曲線下の面積の続きである。 医学分野では連続変数とカテゴリカル変数の関連を表現する指標としてROC曲線下の面積が利用される理由はよく知らないのだが、他にも使える指標があるのではないかと思い、候補を並べてみた。 勉強をしているとROC曲線下の面積…

ROC曲線のサンプルサイズの推定

ROC曲線のサンプルサイズの推定について。質問を受けたので推定方法を書いておこう。 pROCパッケージのpower.roc.test関数を利用する。 aucは目標とするACUの値。任意の値である。 sig.levelは有意水準。デフォルトでは5%となっていて書かなくてもいいし、変…

ROC曲線下の面積

ROC曲線のAUC(Area Under the Curve)はAUCは0から1までの値をとる。値が1だと完全に判別ができており、ランダムであるとき、AUC = 0.5となる。 医学で尺度(連続変数)と診断(2値)の一致度、つまり併存妥当性を表すときに使うらしい。論文でもよく使われるそ…

尺度水準に適した相関係数とシミュレーション

今回は相関係数の比較をする。 通常、相関係数というとピアソンの積率相関係数のことを指す。 ピアソンの積率相関係数は連続変数と連続変数の関連を調べるために使用されるが、連続変数以外でも下記のような相関係数がある。 ピアソンの積率相関係数: 連続変…

分位点でデータをリコードする

以前にもシミュレーションで使っている手技たが一度まとめておこうと思う。 55点が平均で標準偏差15程度のテストっぽい仮想データを作成する。 set.seed(123) # 乱数シードの固定 d1 <- data.frame(rnorm(100, mean=55, sd= 15)) # 100個のデータの作成 d1 <…

全変数の関連を楽に把握する試み(ただし道半ば)

二次分析をする際に、データのどこが使える部分なのかわからない時がしばしばある。そういう時に、褒められた方法とは言えないかもしれないが、全変数の関連を把握できると分析のとっかかりになることがある。 ということで、いかに楽に把握をするかというこ…

相関係数を指定した乱数を作る

相関係数のデモをirisデータで作っていてうまくいかず、サンプルデータを作成した時の副産物。 今回は数学と科学のテスト点のサンプルデータを作った。 使用するのはrmvnormであって多次元正規分布を作成する機能である。パッケージは不要であるmvtnormパッ…

因子分析とカテゴリカル因子分析の結果はとのくらい異なるか

ノーマルな因子分析は連続変数を用いる。その拡張としてカテゴリカル変数でも因子分析は可能である。今回は、連続変数で推定した結果とカテゴリカル因子分析の推定はどのくらい異なるのかをシミュレーションしてみたい。 大前提としてカテゴリカル変数といっ…

StataでLassoとリッジ回帰

Stata16でLassoが新しく使えるようになったそうだ。 https://www.lightstone.co.jp/stata/stata16_new.html#Lasso 僕はStataはあまり使わないので、新しいStataを入手していない。今手元にあるものはバージョン13で少し古く、標準機能でLassoはできない。た…