notebook 001

notebook 001

INPUTとOUTPUTの個人的な備忘録です。

緑本を読みはじめました④:7章 GLMM

今日は7章。GLMM = generalized linear mixed model), 一般化線形混合モデル


  • データにばらつきをもたらす「個体間の差異」は定量化できない。
  • GLMM=「人間が測定できない・測定しなかった個体差」を組み込んだGLM
  • データのばらつきは二項分布・ポアソン分布で、個体のばらつきは正規分布であらわすような、複数の確率分布を部品とする統計モデル。
  • 過分散:ばらつきが大きすぎる。(二項分布で期待されるよりも大きなばらつき)
  • 個体iの個体差をあらわすパラメータ r_iを追加する。こんな感じに
  •  logit(q_i) = \beta_1 + \beta_2 x_i + r_i
  •  r_i -\infty \inftyまでの範囲をとる連続値 、観測できない量なのでどのような確率分布に従うのかわからないが、平均ゼロで標準偏差sの正規分布に従うと仮定する。
  • 線形予測子の構成要素:固定効果とランダム効果
  • GLMMの最尤推定:そのままでは r_iができない。積分して尤度から消す。(この操作の意味は色々な r_iの値における尤度を評価し、その期待値の算出に相当する)二項分布と正規分布をかけて r_i積分する操作はこの2種類の分布を混ぜていることに相当する。
  • 個体差・場所差など複数の個体差を示す変数が出てくると「GLMM+最尤推定」が数学的に難しい→「階層ベイズモデルとMCMC」を使う
  • 反復と擬似反復