因子分析
Kaiser-Meyer-Olkin(KMO)の標本妥当性の測度とMeasures of Sampling Adequacy(MSA)について。 中澤港さんの資料 https://minato.sip21c.org/factor-in-R-j.pdf KMO と MSA KMO とは,Kaiser-Meyer-Olkin が提唱した因子分析全体についてのサンプリング適切性…
因子スコアを独立変数にして、重回帰分析にぶち込んだ論文がいくつか存在していることを知った。 Yakubu, Idahor and Isopa(2009) https://www.researchgate.net/publication/50194274_Using_factor_scores_in_multiple_linear_regression_model_for_predict…
頻度主義で行うのと特に何かが変わるというわけではないものの、Mplusでベイズ推定で因子分析を行った。 コード DATA: FILE = "HS1939.dat"; VARIABLE: NAMES = x1 x2 x3 x4 x5 x6 x7 x8 x9; MISSING=.; ANALYSIS: ESTIMATOR = BAYES; PROCESS = 2; FBITER =…
データとモデルの作成 library("lavaan") Data <- HolzingerSwineford1939[,c("x1","x2","x3","x4", "x5", "x6")] model <- ' f1 =~ x1 + x2 + x3 f2 =~ x4 + x5 + x6 ' fit <- sem(model, data = Data, std.lv = TRUE) lavaanパッケージに含まれているデー…
相関係数をピアソンではなく、ポリコリック相関係数を使う方法。例として簡単な確証的因子分析を行う。 サンプルデータの作成 library(lavaan) data.con <- HolzingerSwineford1939[,c("x1","x2","x3")] # visualのデータのみ使用 ## 3カテゴリにしてカテゴ…
信頼性係数はα係数が使用されることが多いが、問題点が指摘されている。α係数は因子構造を無視して一次元性の検証をしているという点である。別の言い方をすると、各因子での真の得点が共通している(一元性)と仮定しているが、ほとんどのケースでは一元性は…
IPIP-NEOデータの呼び出しと格納 library("psych") data(bfi) # IPIP-NEOデータ d1 <- bfi[1:10] # 因子分析に使用するのは1~10列目。2つの因子のみ。 d1 <-na.omit(d1) # 欠損値のあるケースを削除 モデルと実行 library(lavaan) model <- ' Ag =~ A1 + A…
ω(オメガ)係数は内的整合性を確認するための指標である。近年はCronbachのαより良い方法と言われることが多い。Cronbachのαは因子構造を無視して、一次元性の検証していることが原因である。 データ psychパッケージに含まれるIPIP-NEOのデータbfiを使用する…
階層因子分析(hierarchical factor analysis)について松田淑美・狩野裕「高次因子分析モデルと階層因子分析モデルについて」から説明を引用しよう。 http://www.sigmath.es.osaka-u.ac.jp/~kano/research/meeting/20050827_BSJ33/matsudaABS.pdf 階層因子…
二次因子分析モデル(second order factor analysis)とは「斜交解による通常の因子分析の結果,因子聞に強い相闘が観察されたときには,それらの因子に共通して影響を与える上位の因子を想定することができます。このように,通常の因子分析における複数の因…
複数の観測変数によって1つの構成概念が規定され、その構成概念が別の観測変数群に影響を与えているようなモデルをMIMIC(Multiple Indicator Multiple Cause)モデルと呼ぶ。 MIMICモデルのデモを見ていると、Mplusの例5.8を使ったものが多かったので、それ…
時々気になるサンプルサイズの話である。 pubmed.ncbi.nlm.nih.gov サンプルサイズのについての記述 Henrica et al.(2005)では、下記のように書かれてある。 サンプルサイズ 探索的因子分析も確認的因子分析も、信頼できる結果を得るためには相応のデータ量…
前回のエントリ、2値のカテゴリカル因子分析と潜在クラス分析の結果の差異で因子分析と潜在クラス分析のグループ分けの違いを分析した。 今回は以前のエントリで使用した児童向けウェクスラー式知能検査(Wechsler Intelligence Scale for Children; WISC)…
2値のカテゴリカル因子分析と2値の潜在クラス分析の結果どのように違うのかをシミュレーションしてみたい。因子分析も潜在クラス分析もグループ分けをする手技である。しかし、両者はグループの分け方が異なる。因子分析が変数の近さでグループを作るのに…
ノーマルな因子分析は連続変数を用いる。その拡張としてカテゴリカル変数でも因子分析は可能である。今回は、連続変数で推定した結果とカテゴリカル因子分析の推定はどのくらい異なるのかをシミュレーションしてみたい。 大前提としてカテゴリカル変数といっ…
追記: 019/09/18 以前、psychパッケージのfa.poly functionでカテゴリカル因子分析を書いていたが、非推奨の方法だったようだ。psychパッケージの仕様書には次のように書いてある。 fa.poly Deprecated Exploratory Factor analysis functions. Please use …
落穂拾い的なエントリ。 以前のエントリー(http://ides.hatenablog.com/entry/2019/04/08/171145)で取り上げた清水和秋「因子分析的研究におけるmisuseとartifact」の続き部分である。 kansai-u.repo.nii.ac.jp 平行分析もMAPも主成分を使用 Horn(1965)の…
清水和秋(2018)「因子分析的研究におけるmisuseとartifact」『関西大学社会学部紀要』 49(2): 191-211. kansai-u.repo.nii.ac.jp 標本サイズ Cattell(1978)は、標本サイズと分析対象の変数の数との比として、3 対 1 を目安としている。この比についての基…
Mplusでの平行分析の実行の仕方は以前に書いたが、Rでも実行できる。 今回もbfiデータの1~25列目を使用する(参考: http://ides.hatenablog.com/entry/2019/03/19/093726)。 library("psych") data(bfi) d1<-bfi[1:25] 平行分析は次のように指定する。 fa.par…
因子分析をしていて混同しがちなのは因子負荷(因子パターン)と相関係数ではないかと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(…
探索的因子分析において因子数を決定する基準として使われるMAPについて。 MAP:Minimum Average Partial correlationであり、日本語だと最小平均偏相関になる。 Velicerによつて開発された方法である。 link.springer.com 因子数を決める基準はどれが適切か…
Mplusで因子分析をしたことがなかったので、勉強がてらのメモ。 今回行うのは、下記のエントリで行った探索的因子分析の内容と同じである。 ides.hatenablog.com データはこちらから Mplusのコード TITLE: Exploratory Factor Analysis by Mplus, using NEO …
因子分析の参考書のブックガイドを書いておきたいと思う。 誰も教えてくれなかった因子分析: 数式が絶対に出てこない因子分析入門作者: 松尾太加志,中村知靖出版社/メーカー: 北大路書房発売日: 2002/05/01メディア: 単行本(ソフトカバー)購入: 1人 クリッ…
因子分析の勉強メモ。 カイザー基準は、カイザー・ガットマン基準と呼ぶこともある。これはKaiser(1960)よりも先にGutttman(1954)が先に指摘があったため、連名での表現である。 固有値が1以上のものを因子とする方法である。それは、1つの因子にしか負…
因子分析について少し勉強をしているところである。因子分析は心理学の人が使うことが多く、心理学徒ではない僕は因子分析をほとんど使ったことがなく、勉強もろくにしたことがないので自分の勉強を兼ねてのエントリーである。 今日、取り上げるのは下記の文…
この原稿は統計学勉強会のためにかかれたもので、学校で習うあたりまでの簡単な解説である。 因子分析とは (探索的)因子分析とは、観測できる変数から観察できない因子(潜在変数)を見出す探索し発見する方法である。このように説明してもよくわからないの…