対応パッケージ(代表例)
glmmTMB
最尤推定ベースで、ゼロ過剰(zi)項を明示的に入れられる一般化線形混合モデル(GLMM)実装である。ゼロ過剰ポアソンはもちろん、過分散(負の二項)やランダム効果まで同一の枠組みで扱いやすい。(CRAN)
pscl
古典的に有名な
zeroinfl()(ゼロ過剰)とhurdle()(ハードル)を提供する。まずZIPの挙動を理解し、最短で回して感触を掴む用途に強い。(CRAN)brms
Stanを用いたベイズ推定で、分布として
zero_inflated_poisson()を直接指定できる。ゼロ過剰確率(zi)側にも回帰を入れる「分布回帰」も自然に書ける。(CRAN)gamlss / gamlss.dist
「ゼロ過剰ポアソン(ZIP)」分布(例:
ZIP,ZIP2)を分布として提供し、GAMLSS枠組みで扱う。ゼロ過剰に限らず、分布の形そのものを柔軟に選んでいく路線に向く。(CRAN)mgcv
GAMとしてゼロ過剰(ハードル型を含む)を扱えるファミリ(
ziplssやziP)を提供する。ただし「ゼロが多い=ゼロ過剰」と短絡して乱用しがちなので注意が必要、という警告も明示されている。(Seminar for Statistics)
(このほかVGAM等にも関連機能はあるが、まずは上の5つで実務・学習ともに十分にカバーできる。)
同梱のデモデータ
1) glmmTMB に同梱のデータ
Salamanders
Owls
spider_long
- 内容: クモの生態に関するカウントデータ(ロング形式)として同梱されている。(CRAN)
- ZIP向きの理由: 目的変数がカウントで、設計次第でゼロ過剰・過分散・階層性を試しやすい類型である(ただしゼロ過剰が必ず強いとは限らないので、まず分布確認が前提である)。
2) pscl に同梱のデータ
bioChemists
加えて、psclには ZIP/ハードルを体系的に説明した公式vignette(countreg)があり、デモの設計(何を比較し、どう診断するか)を決めるときの道標になる。(CRAN)