【データ解析のための統計モデリング入門】9章 GLMのベイズモデル化と事後分布の推定

データ解析のための統計モデリング入門を読んでいる。
その読書メモ。

GLMのベイズモデル化

個体{i}の種子数{y_i}のばらつきを平均{\lambda_i}ポアソン分布{p(y_i | \lambda_i)}にしたがうとする。 線形予測子と対数リンク関数を使って、その平均を{\lambda_i = exp(\beta_1 + \beta_2 x_i)}とする。

このモデルの尤度関数は {} $$ L(\beta_1, \beta_2) = \prod_i p(y_i | \lambda_i) = \prod_i p(y_i | \beta_1, \beta_2, x_i) $$

ベイズモデルの事後分布は(尤度)×(事前分布)に比例する。

なぜベイズモデル化するのか?

現実のデータでは、複数のランダム効果がある状況や、隠れた状態を扱わなければならない状況や、空間構造や時系列構造を扱わなければならない状況がある。 そういった複雑な状況に対処するためにベイズ統計モデルが使われるようになってきた。

ベイズ統計モデルの事後分布推定では、

  • GLMの問題を、ベイズモデル化する
  • MCMCサンプリングする
  • 事後分布のサンプルデータを得る
  • サンプルデータから各パラメータの事後分布を推定する

まとめ

  • 全個体に共通するパラメータの事前分布として、「どのような値でもかまわない」ことを表現する無情報事前分布を指定する
  • MCMCアルゴリズムはさまざまなものがあり、特にギブスサンプリングは効率の良い方法のひとつである。

yusuke-ujitoko.hatenablog.com