機械学習・深層学習による自然言語処理入門
2020
中山光樹
本書の特徴として、ほとんどの実装で日本語のデータを使っている点があります。
目次
1-1 本章の概要
1-2 自然言語処理とは?
1-2-1 自然言語と人工言語
1-2-2 自然言語処理
1-3 自然言語処理のタスク
1-3-1 自然言語処理の基礎技術
1-3-2 自然言語処理の応用技術
1-4 自然言語処理の難しさ
1-4-1 おさらい
Chapter 2 機械学習
2-1 本章の概要
2-2 機械学習とは?
2-3 教師あり学習
2-3-1 分類
2-3-2 回帰
2-4 教師なし学習
2-4-1 クラスタリング
2-4-2 次元削減
2-5 強化学習
2-6 機械学習パイプライン
2-4 開発環境の構築
2-7-1 Minicondaのインストール
2-7-2 仮想環境の構築
2-7-3 パッケージのインストール
2-7-4 エディタのインストール
2-7-5 おさらい
3-1 本章の概要
3-2 コーパスとは?
3-3 コーパスの読み込み
3-3-1 ファイル読み書きの基礎
3-3-2 CSVとTSVの読み込み
3-3-3 JSONの読み込み
3-3-4 ディレクトリの走査
3-4 コーパスの作成
3-4-1 プロジェクト構成
3-4-2 APIキーの取得
3-4-3 コードの実装
3-4-4 アノテーションツール
3-4-5 おさらい
4-1 本章の概要
4-2 前処理の種類と実装
4-2-1 テキストのクリーニング
4-2-3 単語の正規化
4-2-5 単語の ID化
4-2-6 パディング
4-3 前処理の実践
4-3-1 プロジェクト構成
4-3-2 データセットの準備
4-3-3 モデルの学習・評価用関数の定義
4-3-4 モデルの学習と評価
4-3-5 おさらい
5-1 本章の概要
5-2 特徴エンジニアリングとは?
5-2-1 質的変数の処理
5-2-2 量的変数の処理
5-3 テキストのベクトル表現
5-4 ベクトル表現の実践
5-4-1 プロジェクト構成
5-4-2 データセットの準備
5-4-3 モデルの学習・評価用関数の定義
5-4-4 モデルの学習と評価
5-5 特徴量のスケーリング
5-5-1 正規化
5-5-2 標準化
5-5-3 正規化と標準化の可視化
5-6 特徴選択
5-6-1 特徴選択とは
5-7 特徴選択の実践
5-7-1 プロジェクト構成
5-7-2 モデルの学習と評価
5-7-3 おさらい
Chapter 6 機械学習アルゴリズム
6-1 本章の概要
6-2-1 分類問題の定式化
6-2-2 分類確率の導入
6-2-3 ロジスティック回帰の学習
6-3 ロジスティック回帰によるテキスト分類
6-3-1 プロジェクト構成
6-3-2 ロジスティック回帰によるテキスト分類の実践
6-8-1 おさらい
Chapter 7 ニューラルネットワーク
7-1 本章の概要
7-2 ニューラルネットワークとは?
7-3 バイアス
7-5 Kerasによるニューラルネットワークの実装 7-5-1 プロジェクト構成
7-5-2 データセットの準備
7-5-3 モデルの定義
7-5-4 損失関数と最適化関数
7-5-5 コールバック
7-5-6 モデルの学習
7-5-7 モデルを使った予測
7-5-8 モデルの保存と読み込み
7-5-9 実践
7-5-10 おさらい
8-1 本章の概要
8-2 単語の分散表現とは?
8-2-1 one-hotエンコーディング
8-2-2 分散表現
8-3 単語分散表現を学習するモデルの仕組み
8-3-1 基礎的な考え方
8-3-4 ネガティブサンプリングによる高速化
8-4 モデルの実装
8-4-1 プロジェクト構成
8-4-2 データセットの準備
8-4-3 モデルの定義
8-4-4 予測用クラスの実装
8-4-5モデルの学習
8-5-1 プロジェクト構成
8-5-2 モデルの学習
8-5-3 単語分散表現の使用
8-6 学習済み単語分散表現の利用
8-6-1 学習済み単語分散表現のダウンロード
8-6-2 単語分散表現の読み込み
8-7 単語分散表現の評価
8-7-1 おさらい
9-1 本章の概要
9-2 テキスト分類とは?
9-3 リカレントニューラルネットワーク
9-4-1 プロジェクト構成
9-4-2 データセットの準備
9-4-3 モデルの定義
9-4-4 予測用クラスの実装
9-4-5 テキスト分類の評価
9-4-6 モデルの学習と評価
9-6 LSTMによるテキスト分類器の構築
9-6-1 モデルの定義
9-6-2 モデルの学習
9-7 畳み込みニューラルネットワーク
9-8-1 モデルの定義
9-8-2 モデルの学習
9-9学習済み単語分散表現の使い方
9-9-1 単語分散表現の準備
9-9-2 モデルの定義
9-9-3 モデルの学習
9-9-4 おさらい
10-1本章の概要
10-2系列ラベリングとは?
10-3固有表現認識
10-4 LSTMによる固有表現認識器の実装
10-4-1 プロジェクト構成
10-4-2 データセットの準備
10-4-3 モデルの定義
10-4-4 予測用クラスの実装
10-4-5 固有表現認識の評価
10-4-6 モデルの学習と評価
10-6 双方向 LSTMによる固有表現認識器の実装
10-6-1 モデルの定義
10-6-2 モデルの学習と評価
10-8 BERTによる固有表現認識器の実装
10-8-1 プロジェクト構成
10-8-2 パッケージのインストール
10-8-3 データセットの準備
10-8-4 モデルの定義
10-8-5 評価用コードの実装
10-8-6 モデルの学習と評価
10-8-7 おさらい
11-1 本章の概要
11-2 系列変換とは?
11-3 系列変換モデルの定式化
11-3-1 エンコーダの埋め込み層
11-3-2 エンコーダの RNN層
11-3-3 デコーダの埋め込み層
11-3-4 デコーダの RNN層
11-3-5 デコーダの出力層
11-4 系列変換モデルの実装
11-4-1 プロジェクト構成
11-4-2 データセットの準備
11-4-3 モデルの定義
11-4-4 予測用クラスの実装
11-4-5 評価
11-4-6 モデルの学習と評価
11-5 アテンション
11-6 アテンションの実装
11-6-1 予測用クラスの実装
11-6-2 モデルの学習と評価
11-6-3 おさらい
Chapter 12 機械学習とクラウド
12-1本章の概要
12-2 Colaboratoryを使った環境構築
12-2-1 基本的な使い方
12-2-2 GPUの使い方
12-2-3 パッケージのインストール方法
12-3-1 モデル選択
12-3-2 ニューラルアーキテクチャサーチ
12-4 Cloud AutoML
12-4-1 APIの有効化
12-4-2 データセットのアップロード
12-4-3 モデルの学習
12-4-4 クリーンアップ
12-5自然言語処理 API
12-5-1 APIキーの取得
12-5-2 コードの実装
12-5-3 API呼び出し
12-5-4 おさらい