井出草平の研究ノート

クラスター分析で用いられていたユークリッド距離はその場しのぎの非類似度測定

ちょっと面白い言い回しを発見。

従来のクラスター分析で用いられていたユークリッド距離のようなその場しのぎの非類似度測定ではなく、LCAの基礎となる確率モデルでは、クラスター数を決定するための正式な統計的手続きが可能であり、確率の観点からより解釈しやすい結果を得ることができる。従来のクラスター分析に対するLCAの利点の詳細については、Magidson and Vermunt (2002)を参照のこと。(p.341)

あまりいい手ではないくらいに個人的には思っていたが、どうやら業界ではad hocと言われているらしい。それは確かにそうかもね。

www.semanticscholar.org

  • Magidson, J. and Vermunt, J. (2002). Latent class models for clustering: a comparison with K-means. Canadian Journal of Marketing Research 20: 37–44.