特徴の型
パターン認識は、対象を観測し、識別に有効な特徴を抽出することから始まる。 観測される特徴は以下のように分類できる。
- 定性的特徴(非数値データ)
- 名義尺度(分類のための単なる名前)
- 順序尺度(順序関係を表す)
- 定量的特徴(数値データ)
- 比例尺度(原点が定まっており、比率が意味を持つ)
- 間隔尺度(一定の単位で量られた量、量間の比が意味を持たない)
次元の呪い
次元が増えると、学習のための必要データ数が指数関数的に増加すること 高次元空間では、一見直観的でない性質がある。 例えば超立方体などを考えてみるとその非直観性がわかる。