マン・ホイットニーのU検定


先日のエントリ(id:iDES:20060515:1147700813)で使われてた検定方法。自分で使ったことはない。少し勉強しなければ。

マン(Mann)・ホイットニー(Whitney)のU検定(-ユーけんてい)はノンパラメトリック統計学的検定で最もよく知られるものの1つである。またウィルコクソン(Wilcoxon)の順位和検定と呼ばれるのも実質的に同じ方法であり、まとめてマン・ホイットニー・ウィルコクソン検定とも呼ばれる。

独立な2組の標本の有意差検定として用いられ、変数は順位としてとれば(つまり2つを比較してどちらが大きいかがわかっていれば)よい。2つの観察された分布の間の重なりの度合が偶然で期待されるよりも小さいかどうかを、「両標本が同じ母集団から抽出された」との帰無仮説に基づいて検定する方法である。
マン・ホイットニーのU検定(Wikipedia)

二群の比較をおこなう各群のケース数が19例と432例であり,かなり異なっている。論文著者は通常のカイ二乗検定を行って「有意である」としているが,期待値が1未満のセルがあるので,カイ二乗検定が不適切である可能性がある。しかし,Exact test によって得られた P 値はほとんど同じであり,検定結果は変わらなかった。
結論は変わらなかったが,このデータにおいて列カテゴリーには順序があるので,マン・ホイットニーのU検定を使うのがよいであろう。
http://aoki2.si.gunma-u.ac.jp/exact/docs/When2Use.html


カイ二乗分布を使った検定では、最小期待度数の推定値は1以上で、なおかつ5未満のをとるセル数は、全セルの2割以下という目安がある。最小期待度数の推定値が、0.5より大きければよいという基準もあるらしい(B.S.エヴェリット『質的データの解析―カイ二乗検定とその展開』)

  • 対応のない2群の比較検定---独立した2群のデータに有意差があるか?
    • parametric--- Student t-test:スチューデントのt検定(2標本t検定)
    • non-parametric--- Mann-Whitney's U test:マン・ホイットニ検定=Wilcoxon rank sum test(注:Wilcoxon signed rank testではない。)
  • Student t-test---平均値を比較して検定する。
  • Mann-Whitney's U test---中央値を比較して検定する。

  • Mann-Whitney's U testは、データの分布形態を問わずに使うことができる。しかし、データが正規分布とみなすことができる場合は、Student t-testのほうが、有意差が出やすい。
  • Mann-Whitney's U testは、有意水準=5%で検定する場合は、n>4以上
  • Mann-Whitney's U testは、有意水準=10%で検定する場合は、n>5以上
  • Mann-Whitney's U testで、2群とも、n<20 の場合、U値の有意点(両側確率)が表示される。計算されたU値が有意点より小さい時、2群間に有意差があると判定する。
  • Mann-Whitney's U testで、「有意差あり」なら「確実に有意差がある。」しかし、「有意差なし」でもt検定で有意差が検出されることがある。そういう場合は、「確実に有意差なし」とは言えず、「有意差については断言できない」という判定になる。
  • 分布の片側に大きな飛び値があったり、正規分布より両裾の広がりが大きい分布かどうかは、ヒストグラムを描いて目で確認することが重要。

http://www.shiga-med.ac.jp/~koyama/stat/test-2g.html


なるほど。


検定の種類の一覧表
http://www.shiga-med.ac.jp/~koyama/stat/comment.html#param