言語処理のための機械学習入門
https://gyazo.com/f923f74ef7035fcf776ca5e66889218c
2010
奥村 学 東工大教授 工博 監修
高村 大也 東工大准教授 博士(工学) 著
1. 必要な数学的知識
1.1 準備と本書における約束事
1.2 最適化問題
1.2.3 等式制約付凸計画問題
1.2.4 不等式制約付凸計画問題
1.3 確率
1.3.1 期待値,平均,分散
1.3.2 結合確率と条件付き確率
1.3.3 独立性
1.4 連続確率変数
1.4.1 平均,分散
1.4.2 連続確率分布の例
1.5 パラメータ推定法
1.6 情報理論
1.6.2 カルバック・ライブラー・ダイバージェンス
1.6.3 ジェンセン・シャノン・ダイバージェンス
1.7 この章のまとめ
章末問題
2. 文書および単語の数学的表現
2.2 nグラム
2.2.1 単語nグラム
2.2.2 文字nグラム
2.3 文書,文のベクトル表現
2.3.1 文書のベクトル表現
2.3.2 文のベクトル表現
2.4 文書に対する前処理とデータスパースネス問題
2.4.1 文書に対する前処理
2.4.2 日本語の前処理
2.4.3 データスパースネス問題
2.5 単語のベクトル表現
2.5.1 単語トークンの文脈ベクトル表現
2.5.2 単語タイプの文脈ベクトル表現
2.6 文書や単語の確率分布による表現
2.7 この章のまとめ
章末問題
3. クラスタリング
3.1 準備
3.6 クラスタリングにおける問題点や注意点
3.7 この章のまとめ
章末問題
4. 分類
4.1 準備
4.2.1 多変数ベルヌーイモデル
4.2.2 多項モデル
4.3.1 マージン最大化
4.3.2 厳密制約下のSVMモデル
4.3.3 緩和制約下のSVMモデル
4.3.4 関数距離
4.3.5 多値分類器への拡張
4.5.1 素性表現の拡張と対数線形モデルの導入
4.5.2 対数線形モデルの学習
4.6.1 自己相互情報量
4.6.2 情報利得
4.7 この章のまとめ
章末問題
5.1 準備
5.2.1 HMMの導入
5.2.2 パラメータ推定
5.2.3 HMMの推論
5.3 通常の分類器の逐次適用
5.4.1 条件付確率場の導入
5.4.2 条件付確率場の学習
5.5 チャンキングへの適用の仕方
5.6 この章のまとめ
章末問題
6. 実験の仕方など
6.1 プログラムとデータの入手
6.2 分類問題の実験の仕方
6.2.1 データの分け方と交差検定
6.2.2 多クラスと複数ラベル
6.3 評価指標
6.3.1 分類正解率
6.3.2 精度と再現率
6.3.3 精度と再現率の統合
6.3.4 多クラスデータを用いる場合の実験設定
6.3.5 評価指標の平均
6.3.6 チャンキングの評価指標
6.5 この章のまとめ
章末問題
付録
A.1 初歩的事項
A.2 logsumexp
A.3 カルーシュ・クーン・タッカー(KKT)条件
A.4 ウェブから入手可能なデータセット
引用・参考文献
章末問題解答
索引