計量

ソマーズのD[R]

SatataでソマーズのDの出力の方法を以前のエントリで書いたのでRでの出し方も書いておこうと思う。 ryoureadyパッケージ ryoureadyパッケージを使うのが最も楽なのではないかと思う。 ord.somers.d関数を利用する。データは「データ作成」以降のスクリプトに…

オッズ比のバリエーション

オッズ比にいくつかの計算方法があるということには少し前から気になっていた。といっても僕の勉強する範囲の研究では古典的なオッズ比以外みたことがなく、何のことかよくわからなかった。 Rのepitoolsパッケージでは4種類のオッズ比が出力できる。何が出力…

相関係数の比較[Stata]

Stataでも相関係数の計算をしてみた。こちらのエントリ尺度水準に適した相関係数とシミュレーションをStataで行ったバージョンである。 データはこちらからダウンロード、もしくは下部にRでの作成方法を掲載しているので、そのままRで走らせると、dta形式の…

2値と連続変数の関連を示す指標

ROC曲線下の面積の続きである。 医学分野では連続変数とカテゴリカル変数の関連を表現する指標としてROC曲線下の面積が利用される理由はよく知らないのだが、他にも使える指標があるのではないかと思い、候補を並べてみた。 勉強をしているとROC曲線下の面積…

ROC曲線のサンプルサイズの推定

ROC曲線のサンプルサイズの推定について。質問を受けたので推定方法を書いておこう。 pROCパッケージのpower.roc.test関数を利用する。 aucは目標とするACUの値。任意の値である。 sig.levelは有意水準。デフォルトでは5%となっていて書かなくてもいいし、変…

ROC曲線下の面積

ROC曲線のAUC(Area Under the Curve)はAUCは0から1までの値をとる。値が1だと完全に判別ができており、ランダムであるとき、AUC = 0.5となる。 医学で尺度(連続変数)と診断(2値)の一致度、つまり併存妥当性を表すときに使うらしい。論文でもよく使われるそ…

尺度水準に適した相関係数とシミュレーション

今回は相関係数の比較をする。 通常、相関係数というとピアソンの積率相関係数のことを指す。 ピアソンの積率相関係数は連続変数と連続変数の関連を調べるために使用されるが、連続変数以外でも下記のような相関係数がある。 ピアソンの積率相関係数: 連続変…

分位点でデータをリコードする

以前にもシミュレーションで使っている手技たが一度まとめておこうと思う。 55点が平均で標準偏差15程度のテストっぽい仮想データを作成する。 set.seed(123) # 乱数シードの固定 d1 <- data.frame(rnorm(100, mean=55, sd= 15)) # 100個のデータの作成 d1 <…

全変数の関連を楽に把握する試み(ただし道半ば)

二次分析をする際に、データのどこが使える部分なのかわからない時がしばしばある。そういう時に、褒められた方法とは言えないかもしれないが、全変数の関連を把握できると分析のとっかかりになることがある。 ということで、いかに楽に把握をするかというこ…

相関係数を指定した乱数を作る

相関係数のデモをirisデータで作っていてうまくいかず、サンプルデータを作成した時の副産物。 今回は数学と科学のテスト点のサンプルデータを作った。 使用するのはrmvnormであって多次元正規分布を作成する機能である。パッケージは不要であるmvtnormパッ…

因子分析とカテゴリカル因子分析の結果はとのくらい異なるか

ノーマルな因子分析は連続変数を用いる。その拡張としてカテゴリカル変数でも因子分析は可能である。今回は、連続変数で推定した結果とカテゴリカル因子分析の推定はどのくらい異なるのかをシミュレーションしてみたい。 大前提としてカテゴリカル変数といっ…

StataでLassoとリッジ回帰

Stata16でLassoが新しく使えるようになったそうだ。 https://www.lightstone.co.jp/stata/stata16_new.html#Lasso 僕はStataはあまり使わないので、新しいStataを入手していない。今手元にあるものはバージョン13で少し古く、標準機能でLassoはできない。た…

Rで相関プロットを描く

相関分析を視覚的に認識するために、相関プロットは有効である。特に、二次分析の際などに威力を発揮するかもしれない。二次分析は仮説があってそれを検証すために調査を作れるわけではないので、どの部分を分析するか、総当たりで検証することもあるからだ…

コマンドラインにふりながを打つ

CUI、コマンドライン、など呼び方はいくつかあるが、統計処理をする際にコマンドを打つ作業が求められることがある。統計学の習得をする際にコマンドを打つという作業でつまづく人は多いらしい。 計量の研究者でもSPSSやAMOSだったらできるが、RやMplusは無…

SPSSでステップワイズ回帰

SPSSでもステップワイズ回帰をやっておこうと思う。 重回帰分析 データは先のエントリと同じくCPS1985を使っている。 通常通り線形回帰のダイアログボックスを表示させる。 方法を「ステップワイズ法」にすればステップワイズ回帰になる。 REGRESSION /MISSI…

Rでステップワイズ回帰

ステップワイズ回帰とは説明する変数(独立変数)に何を入れれば、最も説明力が高いモデルが作れるかを自動的に考えてくれるという方法だ。日本語ではSASのJMPのページの解説がよさそうに思えた。 www.jmp.com PCで統計パッケージを使って行えば、自動的に最も…

ヴィネット調査とその意義

ヴィネット調査というものを知らなかったのでヴィネット調査とその意義について簡単に調べてみた。 ci.nii.ac.jp 松田茂樹,2009,「次世代育成支援策によって出産意向は高まるか--ヴィネット調査による政策効果の推計」『ライフデザインレポート』ライフデ…

コーエンのκのサンプルサイズの推定

前回は、クロンバッハのαのサンプルサイズの推定の方法について述べた。 ides.hatenablog.com 今回はコーエンのκ係数である。 以前にコーエンのκについてエントリを入れているので、知りたい方はこちらから。 ides.hatenablog.com 今回はこちらの論文を扱う…

クロンバッハのαのサンプルサイズの計算方法

新しい質問紙・尺度(主に心理系)を作る際や翻訳をする際に求められることが多い内的整合性・内的妥当性の尺度で比較的有名である。今回は、サンプルサイズの計算方法についてである。 Bonettによる計算式を紹介しよう。 Bonett DG., 2002, "Sample size requ…

カテゴリカル因子分析

追記: 019/09/18 以前、psychパッケージのfa.poly functionでカテゴリカル因子分析を書いていたが、非推奨の方法だったようだ。psychパッケージの仕様書には次のように書いてある。 fa.poly Deprecated Exploratory Factor analysis functions. Please use …

因子分析に関するメモ

落穂拾い的なエントリ。 以前のエントリー(http://ides.hatenablog.com/entry/2019/04/08/171145)で取り上げた清水和秋「因子分析的研究におけるmisuseとartifact」の続き部分である。 kansai-u.repo.nii.ac.jp 平行分析もMAPも主成分を使用 Horn(1965)の…

Mplusのデータファイルとパスの2バイト文字

Mplusのデータファイルの位置について。 絶対パスでデータファイルを指定しないといけないと思っていたのが、相対パスでも大丈夫だということに最近気づいた。 絶対パスとは以下のようなものだ。 DATA: FILE IS "C:\Dropbox\Documents\Study\LCA\data.csv" …

因子分析と標本サイズ

清水和秋(2018)「因子分析的研究におけるmisuseとartifact」『関西大学社会学部紀要』 49(2): 191-211. kansai-u.repo.nii.ac.jp 標本サイズ Cattell(1978)は、標本サイズと分析対象の変数の数との比として、3 対 1 を目安としている。この比についての基…

Rで平行分析

Mplusでの平行分析の実行の仕方は以前に書いたが、Rでも実行できる。 今回もbfiデータの1~25列目を使用する(参考: http://ides.hatenablog.com/entry/2019/03/19/093726)。 library("psych") data(bfi) d1<-bfi[1:25] 平行分析は次のように指定する。 fa.par…

因子負荷と相関係数の違い

因子分析をしていて混同しがちなのは因子負荷(因子パターン)と相関係数ではないかと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(…

MAP(最小平均偏相関)

探索的因子分析において因子数を決定する基準として使われるMAPについて。 MAP:Minimum Average Partial correlationであり、日本語だと最小平均偏相関になる。 Velicerによつて開発された方法である。 link.springer.com 因子数を決める基準はどれが適切か…

Mplusで因子分析 & 因子選択の基準

Mplusで因子分析をしたことがなかったので、勉強がてらのメモ。 今回行うのは、下記のエントリで行った探索的因子分析の内容と同じである。 ides.hatenablog.com データはこちらから Mplusのコード TITLE: Exploratory Factor Analysis by Mplus, using NEO …

因子分析のブックガイド

因子分析の参考書のブックガイドを書いておきたいと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(ソフトカバー)購入: 1人 クリッ…

カイザー基準についてのメモ

因子分析の勉強メモ。 カイザー基準は、カイザー・ガットマン基準と呼ぶこともある。これはKaiser(1960)よりも先にGutttman(1954)が先に指摘があったため、連名での表現である。 固有値が1以上のものを因子とする方法である。それは、1つの因子にしか負…

柳井晴夫「因子分析法の利用をめぐる問題点を中心にして」

因子分析について少し勉強をしているところである。因子分析は心理学の人が使うことが多く、心理学徒ではない僕は因子分析をほとんど使ったことがなく、勉強もろくにしたことがないので自分の勉強を兼ねてのエントリーである。 今日、取り上げるのは下記の文…