系列ラベリング
系列
:単語トークンが連なったもの
例:Nurture passes nature
系列の要素にラベルを付けるのが系列ラベリング
例:
品詞
のタグをつける
Nurture(名詞) passes(動詞) nature(名詞)
このようなタスクは
多クラス分類
(~数百クラス)では解けない
passesの品詞は文脈に依存する
品詞が10個ある言語で、トークン数が20個ある文章の場合、とりうる品詞列は
$ 10^{20}
で爆発する
HMMをつかった系列ラベリングの流れ
系列xとラベルyの
同時確率
$ P(x, y)
を
隠れマルコフモデル
をつかってモデル化
Pの
対数尤度
をとり、その最大値となるパラメータの解析解を
ラグランジュの未定乗数法
で得る
Pを最大とするyを
Viterbi algorithm
で推定する
参考:
言語処理のための機械学習入門
p.147