井出草平の研究ノート

因子分析

DFactorモデル[LatentGOLD]

DFactorモデルとは、Discrete Factor Modelsのことで、離散値の探索的因子分析のアプローチの一つである。 世の中では順序や離散データに対して当たり前のようにPearsonの相関係数と最尤法で因子分析している論文ばかりだが、大きな間違いの一つである。 ア…

カテゴリカルデータの探索的因子分析[Mplus]

EXAMPLE 4.2: EXPLORATORY FACTOR ANALYSIS WITH CATEGORICAL FACTOR INDICATORS www.statmodel.com www.statmodel.com バイナリ(2値)データの因子分析のアプローチは下記の論文のものである。 Muthén, B. (1978). Contributions to factor analysis of dich…

psychパッケージを用いた探索的因子分析のパス図[R]

www.rdocumentation.org データ library(psych) library(GPArotation) data(bfi) d1 <- bfi[1:25] res01 <- fa(d1, nfactors = 5, fm = "ml", rotate = "promax", scores=TRUE) fa.diagram (res01, cut=0.3, simple=FALSE, sort=TRUE, digits=3) オプション …

収束妥当性

A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)作者:Hair Jr., Dr. Joe,Hult, G. Tomas M.,Ringle, Dr. Christian M.,Sarstedt, MarkoSAGE Publications, IncAmazon A Primer on Partial Least Squares Structural Equation Mod…

WLSMV を用いた測定の不変性の計算[Mplus]

Mplusで推定にWLSMV(adjusted diagonally weighted least squares)を使った測定の不変性の確認の方法について。 最尤法は正規分布と連続変数という2つの強力な仮定をすることから、順序尺度や正規分布にならないものの測定の不変性について確認する場合には…

ベイジアンCFAモデル

Structural Equation Modeling: Applications Using Mplus (Wiley Series in Probability and Statistics Book 9) (English Edition)作者:Wang, Jichuan,Wang, XiaoqianWileyAmazon 2.9章から。 従来のCFAモデルでは、各指標・項目は理論的に仮定された1つの…

lavaanを用いてWLSMVによる測定の不変性を計算する[R]

WLSMV(adjusted diagonally weighted least squares)での測定の不変性の方法が確立しているらしい。 https://www.tandfonline.com/doi/abs/10.1080/10705511.2019.1602776 最尤法での測定の不変性についてはこちらを参照のこと。 ides.hatenablog.com サンプ…

Kaiser-Meyer-Olkinの標本妥当性の測度とMeasures of Sampling Adequacy

Kaiser-Meyer-Olkin(KMO)の標本妥当性の測度とMeasures of Sampling Adequacy(MSA)について。 中澤港さんの資料 https://minato.sip21c.org/factor-in-R-j.pdf KMO と MSA KMO とは,Kaiser-Meyer-Olkin が提唱した因子分析全体についてのサンプリング適切性…

因子スコアを重回帰分析の独立変数にした論文

因子スコアを独立変数にして、重回帰分析にぶち込んだ論文がいくつか存在していることを知った。 Yakubu, Idahor and Isopa(2009) https://www.researchgate.net/publication/50194274_Using_factor_scores_in_multiple_linear_regression_model_for_predict…

ベイズ推定による因子分析[Mplus]

頻度主義で行うのと特に何かが変わるというわけではないものの、Mplusでベイズ推定で因子分析を行った。 コード DATA: FILE = "HS1939.dat"; VARIABLE: NAMES = x1 x2 x3 x4 x5 x6 x7 x8 x9; MISSING=.; ANALYSIS: ESTIMATOR = BAYES; PROCESS = 2; FBITER =…

lavaanで潜在変数の相関係数を求める[R]

データとモデルの作成 library("lavaan") Data <- HolzingerSwineford1939[,c("x1","x2","x3","x4", "x5", "x6")] model <- ' f1 =~ x1 + x2 + x3 f2 =~ x4 + x5 + x6 ' fit <- sem(model, data = Data, std.lv = TRUE) lavaanパッケージに含まれているデー…

lavaanで順序尺度のSEMを行う[R]

相関係数をピアソンではなく、ポリコリック相関係数を使う方法。例として簡単な確証的因子分析を行う。 サンプルデータの作成 library(lavaan) data.con <- HolzingerSwineford1939[,c("x1","x2","x3")] # visualのデータのみ使用 ## 3カテゴリにしてカテゴ…

同族テストモデル・タウ等価モデル・平行テストモデル[R]

信頼性係数はα係数が使用されることが多いが、問題点が指摘されている。α係数は因子構造を無視して一次元性の検証をしているという点である。別の言い方をすると、各因子での真の得点が共通している(一元性)と仮定しているが、ほとんどのケースでは一元性は…

lavaanで順序カテゴリカル因子分析[R]

IPIP-NEOデータの呼び出しと格納 library("psych") data(bfi) # IPIP-NEOデータ d1 <- bfi[1:10] # 因子分析に使用するのは1~10列目。2つの因子のみ。 d1 <-na.omit(d1) # 欠損値のあるケースを削除 モデルと実行 library(lavaan) model <- ' Ag =~ A1 + A…

ω係数[R]

ω(オメガ)係数は内的整合性を確認するための指標である。近年はCronbachのαより良い方法と言われることが多い。Cronbachのαは因子構造を無視して、一次元性の検証していることが原因である。 データ psychパッケージに含まれるIPIP-NEOのデータbfiを使用する…

lavaanパッケージを用いて階層因子分析を推定する[R]

階層因子分析(hierarchical factor analysis)について松田淑美・狩野裕「高次因子分析モデルと階層因子分析モデルについて」から説明を引用しよう。 http://www.sigmath.es.osaka-u.ac.jp/~kano/research/meeting/20050827_BSJ33/matsudaABS.pdf 階層因子…

lavaanパッケージを用いて二次因子分析モデルを推定する[R]

二次因子分析モデル(second order factor analysis)とは「斜交解による通常の因子分析の結果,因子聞に強い相闘が観察されたときには,それらの因子に共通して影響を与える上位の因子を想定することができます。このように,通常の因子分析における複数の因…

確証的因子分析におけるMIMICモデル[R][Mplus]

複数の観測変数によって1つの構成概念が規定され、その構成概念が別の観測変数群に影響を与えているようなモデルをMIMIC(Multiple Indicator Multiple Cause)モデルと呼ぶ。 MIMICモデルのデモを見ていると、Mplusの例5.8を使ったものが多かったので、それ…

因子分析のサンプルサイズは項目数×7で求められるのか

時々気になるサンプルサイズの話である。 pubmed.ncbi.nlm.nih.gov サンプルサイズのについての記述 Henrica et al.(2005)では、下記のように書かれてある。 サンプルサイズ 探索的因子分析も確認的因子分析も、信頼できる結果を得るためには相応のデータ量…

2値カテゴリカル因子分析と潜在クラス分析のシミュレーション, その2

前回のエントリ、2値のカテゴリカル因子分析と潜在クラス分析の結果の差異で因子分析と潜在クラス分析のグループ分けの違いを分析した。 今回は以前のエントリで使用した児童向けウェクスラー式知能検査(Wechsler Intelligence Scale for Children; WISC)…

2値のカテゴリカル因子分析と潜在クラス分析の結果の差異

2値のカテゴリカル因子分析と2値の潜在クラス分析の結果どのように違うのかをシミュレーションしてみたい。因子分析も潜在クラス分析もグループ分けをする手技である。しかし、両者はグループの分け方が異なる。因子分析が変数の近さでグループを作るのに…

因子分析とカテゴリカル因子分析の結果はとのくらい異なるか

ノーマルな因子分析は連続変数を用いる。その拡張としてカテゴリカル変数でも因子分析は可能である。今回は、連続変数で推定した結果とカテゴリカル因子分析の推定はどのくらい異なるのかをシミュレーションしてみたい。 大前提としてカテゴリカル変数といっ…

カテゴリカル因子分析

追記: 019/09/18 以前、psychパッケージのfa.poly functionでカテゴリカル因子分析を書いていたが、非推奨の方法だったようだ。psychパッケージの仕様書には次のように書いてある。 fa.poly Deprecated Exploratory Factor analysis functions. Please use …

因子分析に関するメモ

落穂拾い的なエントリ。 以前のエントリー(http://ides.hatenablog.com/entry/2019/04/08/171145)で取り上げた清水和秋「因子分析的研究におけるmisuseとartifact」の続き部分である。 kansai-u.repo.nii.ac.jp 平行分析もMAPも主成分を使用 Horn(1965)の…

因子分析と標本サイズ

清水和秋(2018)「因子分析的研究におけるmisuseとartifact」『関西大学社会学部紀要』 49(2): 191-211. kansai-u.repo.nii.ac.jp 標本サイズ Cattell(1978)は、標本サイズと分析対象の変数の数との比として、3 対 1 を目安としている。この比についての基…

Rで平行分析

Mplusでの平行分析の実行の仕方は以前に書いたが、Rでも実行できる。 今回もbfiデータの1~25列目を使用する(参考: http://ides.hatenablog.com/entry/2019/03/19/093726)。 library("psych") data(bfi) d1<-bfi[1:25] 平行分析は次のように指定する。 fa.par…

因子負荷と相関係数の違い

因子分析をしていて混同しがちなのは因子負荷(因子パターン)と相関係数ではないかと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(…

MAP(最小平均偏相関)

探索的因子分析において因子数を決定する基準として使われるMAPについて。 MAP:Minimum Average Partial correlationであり、日本語だと最小平均偏相関になる。 Velicerによつて開発された方法である。 link.springer.com 因子数を決める基準はどれが適切か…

Mplusで探索的因子分析を行う

Rでの方法はこちらを参照。 ides.hatenablog.com データはRのpsychパッケージに含まれるものを利用するので、作成方法は下部に記載する。 (追記: 2021/12/06) データの内容についてはこちらを参照。 Mplusのコード TITLE: Exploratory Factor Analysis by Mp…

因子分析のブックガイド

因子分析の参考書のブックガイドを書いておきたいと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(ソフトカバー)購入: 1人 クリッ…