言語処理のための機械学習入門

https://gyazo.com/f923f74ef7035fcf776ca5e66889218c

2010

奥村学東工大教授工博監修

高村大也東工大准教授博士（工学）著

https://www.coronasha.co.jp/np/isbn/9784339027518/

1.　必要な数学的知識

1.1　準備と本書における約束事

1.2　最適化問題

1.2.1　凸集合と凸関数

1.2.2　凸計画問題

1.2.3　等式制約付凸計画問題

1.2.4　不等式制約付凸計画問題

1.3　確率

1.3.1　期待値，平均，分散

1.3.2　結合確率と条件付き確率

1.3.3　独立性

1.3.4　代表的な離散確率分布

1.4　連続確率変数

1.4.1　平均，分散

1.4.2　連続確率分布の例

1.5　パラメータ推定法

1.5.1　i.i.d.と尤度

1.5.2　最尤推定

1.5.3　最大事後確率推定

1.6　情報理論

1.6.1　エントロピー

1.6.2　カルバック・ライブラー・ダイバージェンス

Kullback-Leibler divergence

1.6.3　ジェンセン・シャノン・ダイバージェンス

Jensen-Shannon divergence

1.6.4　自己相互情報量

1.6.5　相互情報量

1.7　この章のまとめ

章末問題

2.　文書および単語の数学的表現

2.1　タイプ，トークン

2.2　nグラム

N-gram

2.2.1　単語nグラム

2.2.2　文字nグラム

2.3　文書，文のベクトル表現

2.3.1　文書のベクトル表現

2.3.2　文のベクトル表現

2.4　文書に対する前処理とデータスパースネス問題

2.4.1　文書に対する前処理

2.4.2　日本語の前処理

2.4.3　データスパースネス問題

2.5　単語のベクトル表現

2.5.1　単語トークンの文脈ベクトル表現

2.5.2　単語タイプの文脈ベクトル表現

2.6　文書や単語の確率分布による表現

2.7　この章のまとめ

章末問題

3.　クラスタリング

3.1　準備

3.2　凝集型クラスタリング

3.3　k-平均法

K-means

3.4　混合正規分布によるクラスタリング

3.5　EMアルゴリズム

3.6　クラスタリングにおける問題点や注意点

3.7　この章のまとめ

章末問題

4.　分類

4.1　準備

4.2　ナイーブベイズ分類器

4.2.1　多変数ベルヌーイモデル

4.2.2　多項モデル

4.3　サポートベクトルマシン

4.3.1　マージン最大化

4.3.2　厳密制約下のSVMモデル

4.3.3　緩和制約下のSVMモデル

4.3.4　関数距離

4.3.5　多値分類器への拡張

4.4　カーネル法

4.5　対数線形モデル

4.5.1　素性表現の拡張と対数線形モデルの導入

4.5.2　対数線形モデルの学習

4.6　素性選択

4.6.1　自己相互情報量

4.6.2　情報利得

4.7　この章のまとめ

章末問題

5.　系列ラベリング

5.1　準備

5.2　隠れマルコフモデル

5.2.1　HMMの導入

5.2.2　パラメータ推定

5.2.3　HMMの推論

5.3　通常の分類器の逐次適用

5.4　条件付確率場

5.4.1　条件付確率場の導入

5.4.2　条件付確率場の学習

5.5　チャンキングへの適用の仕方

5.6　この章のまとめ

章末問題

6.　実験の仕方など

6.1　プログラムとデータの入手

6.2　分類問題の実験の仕方

6.2.1　データの分け方と交差検定

6.2.2　多クラスと複数ラベル

6.3　評価指標

6.3.1　分類正解率

6.3.2　精度と再現率

6.3.3　精度と再現率の統合

6.3.4　多クラスデータを用いる場合の実験設定

6.3.5　評価指標の平均

6.3.6　チャンキングの評価指標

6.4　検定

6.5　この章のまとめ

章末問題

付録

A.1　初歩的事項

A.2　logsumexp

A.3　カルーシュ・クーン・タッカー（KKT）条件

Karush-Kuhn-Tucker condition

A.4　ウェブから入手可能なデータセット

引用・参考文献

章末問題解答

索引