【データ解析のための統計モデリング入門】10章 階層ベイズモデル

データ解析のための統計モデリング入門を読んでいる。
その読書メモ。

この章では、階層事前分布を使って一般化線形混合モデルを階層ベイズモデルとして扱う方法を説明。 個体差などを組み込んだ現実的な統計モデルを構築するためには、無情報事前分布だけではなく階層事前分布も使わなければならない。

例題設定

GLMMを以下のように設定する。
切片{\beta}は全個体に共通するパラメータ、
個体差を表す{r_i}は平均ゼロで標準偏差{s}正規分布に従うと仮定。
データが得られる確率{p(Y|\beta, {r_{i}})}
{} $$ logit(q_i) = \beta + r_i $$

となり、推定したい事後分布は、事後分布∝{p(Y|\beta, {r_{i}})}×事前分布となるのであとは事前分布を指定すれば統計モデルの設計は完了。 {\beta}の事前分布は無情報事前分布を指定する。平均ゼロで標準偏差100のひらべったい正規分布とする。(式は略)

個体差{r_i}のパラメータの事前分布はどうすればよいか。
個体ごとにことなるパラメータ{r_i}がいずれも平均ゼロで標準偏差{s}正規分布に従うと仮定していた。
この正規分布の分散の事後分布を推定する必要がある。その事前分布は無情報事前分布とする。

このように、個体差{r_i}の事前分布{p(r_i|s)}の形を決める{s}という未知パラメータがあって、この{s} についても事前分布が設定されているときに、階層事前分布と呼ぶ。

まとめ

  • GLMMをベイズモデル化すると階層ベイズモデルになる
  • 階層ベイズモデルとは、事前分布を使うことで、ベイズ統計モデルから主観的な事前分布を排除できる
  • 個体差+場所差といった複雑な構造のあるデータの統計モデリングでは、階層ベイズモデルとMCMCサンプリングによるパラメータ推定の組み合わせで対応するのが良い

yusuke-ujitoko.hatenablog.com