緑茶思考ブログ

【データ解析のための統計モデリング入門】9章 GLMのベイズモデル化と事後分布の推定

統計

データ解析のための統計モデリング入門を読んでいる。
その読書メモ。

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

作者: 久保拓弥
出版社/メーカー: 岩波書店
発売日: 2012/05/19
メディア: 単行本
購入: 16人クリック: 163回
この商品を含むブログ (29件) を見る

GLMのベイズモデル化

個体 ${i}$ の種子数 ${y_i}$ のばらつきを平均 ${\lambda_i}$ のポアソン分布 ${p(y_i | \lambda_i)}$ にしたがうとする。線形予測子と対数リンク関数を使って、その平均を ${\lambda_i = exp(\beta_1 + \beta_2 x_i)}$ とする。

このモデルの尤度関数は ${}$ $$ L(\beta_1, \beta_2) = \prod_i p(y_i | \lambda_i) = \prod_i p(y_i | \beta_1, \beta_2, x_i) $$

ベイズモデルの事後分布は（尤度）×（事前分布）に比例する。

なぜベイズモデル化するのか？

現実のデータでは、複数のランダム効果がある状況や、隠れた状態を扱わなければならない状況や、空間構造や時系列構造を扱わなければならない状況がある。そういった複雑な状況に対処するためにベイズ統計モデルが使われるようになってきた。

ベイズ統計モデルの事後分布推定では、

GLMの問題を、ベイズモデル化する
MCMCサンプリングする
事後分布のサンプルデータを得る
サンプルデータから各パラメータの事後分布を推定する

まとめ

全個体に共通するパラメータの事前分布として、「どのような値でもかまわない」ことを表現する無情報事前分布を指定する
MCMC アルゴリズムはさまざまなものがあり、特にギブスサンプリングは効率の良い方法のひとつである。

yusuke-ujitoko.hatenablog.com