隠れマルコフモデルを用いた単語尤度と連接尤度の意味付け
品詞の列$ \bold{C}と,推定された品詞の列$ \hat{\bold{C}}を考える(形態素解析) $ P(\bold{C}),ある言語において品詞列$ \bold{C}が生じるもっともらしさ
$ P(\bold{w} \mid \bold{C}),ある言語において品詞列$ \bold{C}に単語列$ \bold{w}という単語列が対応するもっともらしさ
例えば
$ \bold{C} = \text{N, V, P, Det, N}(各々,名詞Nounなど)
$ \bold{w} = \text{time, flies, like, an, arrow}
ならよく適合すると考えられる
無限に可能性があるので,いくつか近似を行う
$ \hat{\bold{C}} = \argmax_\bold{C} P(\bold{C})P(\bold{w} \mid \bold{C})
$ \hat{C_1} \cdots \hat{C_n} = \argmax_{C_1 \cdots C_n} = P(C_1 \cdots C_n)P(w_1 \cdots w_n \mid C_1 \cdots C_n)
今,$ C_{i}はまさに$ C_{i-1}のみに依存して決定され,$ C_{i-2}以前は捨象してよい,という単純マルコフ過程であるとする つまり,$ P(C_1 \cdots C_{n}) \cong P(C_1)P(C_2 \mid C_1) \cdots P(C_n \mid C_{n-1})
さらに計算の簡単のために$ P(C_1) = P(C_1 \mid C_0)とすると
よって
$ P(C_1 \cdots C_{n}) \cong \prod_{i=1}^n P(C_{i} \mid C_{i-1})
品詞$ C_iが$ C_i以外に影響されずに単語$ w_iと置き換えられると仮定する
つまり,$ P(w_1 \cdots w_n \mid C_1 \cdots C_n) \cong P(w_1 \mid C_1)P(w_2 \mid C_2) \cdots P(w_n \mid C_{n})
よって
$ P(w_1 \cdots w_n \mid C_1 \cdots C_n) \cong \prod_{i=1}^n P(w_i \mid C_i)
最終的に,
$ \hat{C_1} \cdots \hat{C_n} \cong \argmax_{C_1 \cdots C_{n}} \prod_{i=1}^n P(C_{i} \mid C_{i-1})P(w_i \mid C_i)
このとき,$ P(C_i \mid C_{i-1})が連接尤度,$ P(w_i \mid C_i)が単語尤度と位置づけられると考えて良い