計量

lavaanパッケージを用いてPLSモデルを推定する

PLS(Partial Least Squares)モデルについて。日本語にすると部分的最小二乗回帰である。 PLSモデルは,複数の観測変数によって純粋に指標化された新たな変数が,別の複数の観測変数の背後に仮定される構成概念へ及ぼす影響の強さについて検討するモデルであ…

lavaanパッケージにおける共分散構造分析の付加的分析[R]

非標準化推定値と標準化推定値 豊田秀樹『共分散構造分析[R編]』36ページから。 母数の推定値には,非標準化推定値と標準化推定値があります。非標準化推定値は,データを標準化せずに分析を行った際に得られる推定値で,変数の単位の影響を受けます。一方,…

SEMの推定値の解釈[R]

lavaanパッケージで行った共分散構造分析の補足的なエントリ。 ides.hatenablog.com 例として潜在変数のところだけピックアップする。 Latent Variables: Estimate Std.Err z-value P(>|z|) Std.lv Std.all ind60 =~ x1 1.000 0.670 0.920 x2 2.180 0.139 15…

因子分析のサンプルサイズは項目数×7で求められるのか

時々気になるサンプルサイズの話である。 pubmed.ncbi.nlm.nih.gov サンプルサイズのについての記述 Henrica et al.(2005)では、下記のように書かれてある。 サンプルサイズ 探索的因子分析も確認的因子分析も、信頼できる結果を得るためには相応のデータ量…

回帰分析を利用した併存的妥当性

併存妥当性に回帰分析を利用する手法があると教えてもらったのでエントリを入れておきたい。 ci.nii.ac.jp この論文はパニック障害の尺度を作成するという論文である。PDSS(Panic Disorder Severity Scale)という尺度があり、その日本語版、かつ、自記式版の…

弁別的妥当性

WikipediaのDiscriminant validityの翻訳。 en.wikipedia.org 弁別的妥当性 心理学では、弁別的妥当性は、関連していると思われない概念や測定値が実際には関連していないかどうかをテストすることがある。 Campbell and Fiske (1959) は、検定妥当性の評価…

クロス表から元データを復元する

クロス表の再分析をする機会があり、データから元データに変換する必要があったので少し調べてみた。 元データという呼び方はもちろん適切ではない。 呼び方を調べてみたのだがよくわからないのだが、意図としては、ケースが行、変数が列になっているデータ…

全変数の相関係数をcsvで書き出す

以前エントリしたhetcor関数を使った全変数の関連を把握する試みの続き。 ides.hatenablog.com エントリを入れたときにはサンプルデータでやったのでうまくいったが、実際のデータでやってみたところ使いにくさを感じた。 困った点はは変数が多すぎると相関…

texregの結果をRstudioで取り込むには

今回は2年以上前のエントリの続きである。 ides.hatenablog.com 一番下の節で紹介しているtexregパッケージを実戦で使ってみたのだが意外に使いにくい。 確かに、HTML形式で綺麗な回帰分析は作れるが、それをRstudioに張り付けてレポートにすること、つまり…

アドヒアランスの指標であるMPRとPDCを計算するパッケージ[Stata]

The Stata Journalを読んでいたらMPRとPDCを計算するパッケージの紹介があったので、こちらで紹介しておこう。 https://journals.sagepub.com/doi/pdf/10.1177/1536867X19893625 http://www.lindenconsulting.org/stats.html NPRとは薬剤保持率(medication …

潜在プロファイル分析の標準書式での書き換え

mclustパッケージを使った潜在プロファイル分析のエントリではパイプ演算子によるコードを使用していた。 ides.hatenablog.com パイプを使わずにRの標準書式での記述を示しておきたい。 参考までに、パイプ演算子での表記も併記しておく。 まず、young_peopl…

SPSS、SAS、StataのデータをRでインポート、エクスポートをする

SPSS、SAS、StataのデータをRでインポート、エクスポートをするhavenパッケージの紹介である。 havenパッケージはtidyverseを構成するパッケージの一つである。 他の統計パッケージのデータを読み込む有名なパッケージはforeignだが、RStudioブログによると…

Rのmclustパッケージで潜在プロファイル分析

今回はRのmclustパッケージで潜在プロファイル分析を行う方法について解説したい。 潜在クラス分析はカテゴリカル変数、潜在プロファイル分析は(基本的には)連続変数という違いはあるものの、ケースごとのパターンからクラス分けをするのは同じである。 使い…

RからMplusを使う Rですべて完結させる

RからMplusが使えるようになるMplusAutomationパッケージについてのエントリ2つ目。 前回はデータをMplus形式に変換する方法について解説した。 ides.hatenablog.com 今回も下記の条件で書いている。 RStudioを使っている ファルダパスに日本語が混じってい…

RからMplusを使う ファイル変換編

RからMplusが使えるようになるMplusAutomationパッケージというものがある。 cran.r-project.org 有用な関数が複数含まれているので使い方がいくつかあるが、今回はRを使ってMplusのデータとコードの一部を作る方法を紹介しよう。 RStudioを利用する RとMplu…

1台のパソコンで異なったバージョンのMplusを使うには

今日は小技の紹介。 1台のパソコンで異なったバージョンのMplusを使うにはどうしたらよいか、という話である。 このようなことを試みた人はあまりいないかもしれないが、Mplusの異なったバージョンを同じPCにインストールしてもうまく使えない。 今回のはそ…

Stata LCA プラグインを使用した潜在クラス分析 導入偏

Stata15から標準機能で潜在クラス分析ができるようになっている。 ただ、基本的な機能しかないため、Stataの標準機能の潜在クラス分析は現在のところ実用に耐えられない。そこで、面倒な作業が必要になるが、Lanzaらが作成したStata LCA プラグインを使わざ…

99ルール - ブートストラップは99回反復しろ!

今回は潜在クラス分析のBLRTのエントリの積み残しである。 RandomLCAパッケージを用いた潜在クラス分析とBLRT[R] 先のエントリーでは修正値を変更すればブートストラップの反復回数は連動して変えられるのでは?と書いていたが、修正値は1のままで、一般的…

poLCAでデータ加工をしてRandomLCAでBLRTの計算をする[R]

私たちが使い慣れているデータ(行にケース、列に変数という形式のもの)を使ってRでブートストラップ尤度比検定(Bootstrapped Likelihood Ratio Test)を計算する方法についてのエントリである。 poLCAには残念ながらBLRTの機能がないので、poLCAのpredcell関…

RandomLCAパッケージを用いた潜在クラス分析とBLRT[R]

Rで潜在クラス分析をするパッケージとしてはpoLCAが有名だが、RandomLCAでも潜在クラス分析ができる。 poLCAではブートストラップ尤度比検定(Bootstrapped Likelihood Ratio Test: BLRT)ができないが、RandomLCAではできるらしい。 cran.r-project.org Rando…

潜在クラス分析のエントロピーの計算[R]

RのpoLCAパッケージで潜在クラス分析のエントロピーを計算してみたい。 相対的エントロピーと絶対的エントロピー エントロピーという指標はMplusユーザーにとってはお馴染みのものである。 Mplusで出力されるのは正確に言うと、相対的エントロピー(Relative …

共変量を伴った潜在クラス分析[R]

Rで共変量を伴った潜在クラス分析を行ってみたい。 パッケージはpoLCAを使う。 poLCAパッケージを利用した潜在クラス分析は以前にエントリしている。 RのpoLCAパッケージで潜在クラス分析を行う 共変量とは何かというのは、以前にMplusでの方法をエントリし…

潜在クラス分析の応答確率の棒グラフ[Stata]

Stataでは潜在クラス分析の応答確率の棒グラフが描ける。棒グラフというのは今まで見たことがなかった。不要な気もしないでもないが、説明するときにわかりやすいのかもしれない。 使用するのはmarginsとmarginsplotである。説明によると条件付き応答確率の…

潜在クラス分析[Stata]

Stataで潜在クラス分析ができるのでやってみた。 Stata15から標準機能で利用できるらしい。 Lanzaらのプラグインを使えばStata11から利用可能である。 www.methodology.psu.edu Stataの標準機能だと機能が足りないように思うので、Lanzaらのパッケージを結局…

有病率の計算[R]

こちらのエントリでStataで行ったことをRでもやってみたい。 有病率の計算はprevalenceパッケージを用いる。 prevalence.cbra.be prevalenceパッケージはベイズ統計学の計算にJAGSとrjagsを利用する。 JAGSを使ったことがない場合には、インストールが必要で…

有病率の計算[Stata]

疫学調査で有病率を出す方法である。専門用語では母比率の推定という。日本語で母比率と言うとピンとこないが、英語だとpopulation rateなので、こちらの方が直感的に理解できるはずである。 Stataで有病率を推定する Stataではcii propコマンドを使用する。…

ソマーズのD[R]

SatataでソマーズのDの出力の方法を以前のエントリで書いたのでRでの出し方も書いておこうと思う。 ryoureadyパッケージ ryoureadyパッケージを使うのが最も楽なのではないかと思う。 ord.somers.d関数を利用する。データは「データ作成」以降のスクリプトに…

オッズ比のバリエーション

オッズ比にいくつかの計算方法があるということには少し前から気になっていた。といっても僕の勉強する範囲の研究では古典的なオッズ比以外みたことがなく、何のことかよくわからなかった。 Rのepitoolsパッケージでは4種類のオッズ比が出力できる。何が出力…

相関係数の比較[Stata]

Stataでも相関係数の計算をしてみた。こちらのエントリ尺度水準に適した相関係数とシミュレーションをStataで行ったバージョンである。 データはこちらからダウンロード、もしくは下部にRでの作成方法を掲載しているので、そのままRで走らせると、dta形式の…

2値と連続変数の関連を示す指標

ROC曲線下の面積の続きである。 医学分野では連続変数とカテゴリカル変数の関連を表現する指標としてROC曲線下の面積が利用される理由はよく知らないのだが、他にも使える指標があるのではないかと思い、候補を並べてみた。 勉強をしているとROC曲線下の面積…