【はじめてのパターン認識】第3章 ベイズの識別規則
はじめてのパターン認識を読んでいる。
その個人的メモ。
- 作者: 平井有三
- 出版社/メーカー: 森北出版
- 発売日: 2012/07/31
- メディア: 単行本(ソフトカバー)
- 購入: 1人 クリック: 7回
- この商品を含むブログ (3件) を見る
本章では、ベイズの識別規則とROC曲線についての説明がメインになされている。
ベイズの識別規則
観測データを、識別クラスをとする。
ベイズの識別規則は次式で定義される事後確率が最大なクラスに観測データを分類する、というもの。
- 事後確率
- クラス条件付き確率(尤度)
- 周辺確率
- 事前確率 として、 $$ P(C_i | x) = \frac{p(x|C_i)}{p(x)} \times P(C_i) = (修正項) \times (事前確率) $$
この式から、事前確率が尤度と周辺確率で修正されて事後確率が得られることがわかる。
具体的には、
クラスを指定した時のxの生起確率である尤度が、 クラスを指定しない時の生起確率よりも
- 大きければ、事後確率は事前確率より大きくなり、
- 小さければ、事後確率は事前確率より小さくなる
クラスとクラスの識別境界は、事後確率が等しくなるところ、すなわち、 $$ P(C_i|x) = P(C_i | x) = \frac{p(x|C_i)}{p(x)} \times P(C_i) = \frac{p(x|C_j)}{p(x)} \times P(C_j) = P(C_j | x) $$ が成り立つところとなる。 式からわかるように周辺確率ははどちらのクラスにも共通に現れているため、識別規則に含める必要はない。 したがって、ベイズの識別規則は、(識別クラス) = で与えられる。
ベイズの識別規則は誤り率最小
2クラスの識別問題を用いて、ベイズの識別規則が誤り率を最小にすることを示す。
ベイズの識別規則によれば、クラスの事後確率がクラスの事後確率より
- 大きい時、入力ベクトルをクラスに識別する
- 小さい時、入力ベクトルをクラスに識別する
したがって、ベイズの識別規則のもとでの誤り率は事後確率の小さい方になるので、 $$ \epsilon(x) = min[P(C_1|x), P(C_2,x)] $$ となる。
受信者動作特性曲線(ROC曲線:receiver operator characteristics curve)
ROCに関しては下記の記事が詳しく、大変参考になる。
【統計学】ROC曲線とは何か、アニメーションで理解する。 - Qiita