『エンジニアのためのデータ分析基盤入門』
https://gyazo.com/537d582f1395a843858bd30498766826
2022/2/24
データ分析基盤を取り巻く「人」「技術」「環境」
1.1 データ分析基盤の変遷
多様化を受け入れるために進化する
1.2 処理基盤/クラスターの変遷
よりマネージレスにしてコストを減らし,より本来の業務へ集中する時代
1.3 データの変遷
ExcelからWeb,IoT,そして何でもあり(!?)へ
1.4 データ分析基盤に関わる人の変遷
データにまつわる多様な人材
1.5 データへの価値観の変化
データ品質の重要度が高まってきた
1.6 データにおける開発の変遷
複雑化するプロダクトと人の関係
1.7 本章のまとめ
第2章 データエンジニアリングの基礎知識
4つのレイヤー
2.1 データエンジニアリングの基本
ポイントと本書内の関連章について
2.2 データの世界のレイヤー
データ分析基盤の世界を俯瞰する
2.3 コレクティングレイヤー
データを集める
2.4 プロセシングレイヤー
データを変換する
2.5 ストレージレイヤー
データやメタデータを貯蔵する
2.6 アクセスレイヤー
データ分析基盤と外の世界との連携
2.7 本章のまとめ
第3章 データ分析基盤の管理&構築
セルフサービス,SSoT,タグ,ゾーン,メタデータ管理
3.1 セルフサービスの登場
全員参加時代への移行期
3.2 SSoT
データは1ヵ所に集めよう
3.3 データ管理デザインパターン
ゾーンとタグ
3.4 データの管理とバックアップ
データ整理と,もしものときの準備
3.5 データのアクセス制御
ほど良いアクセス権限の適用
3.6 One Size Fits All問題
デカップリングで数々の問題を解決しよう
3.7 データのライフサイクルマネジメント
不要なデータを残さないために
3.8 メタデータとデータ品質による管理
データを知る基本ツール
3.9 ハイブリット構成
ハイブリッドが抱える問題
3.10 本章のまとめ
第4章 データ分析基盤の技術スタック
データソースからアクセスレイヤー,クラスター,ワークフローエンジンまで
4.1 データ分析基盤の技術スタック
全体像を俯瞰する
4.2 データ分析基盤のためのクラスター選択
無理な利用にも耐えられる必要がある
4.3 コレクティングレイヤーの技術スタック
セルフサービス時代のデータの取り込み
4.4 プロセシングレイヤーの技術スタック
データ変換を行うレイヤー
4.5 ワークフローエンジン
データ取り込みと変換を統括する
4.6 ストレージレイヤーの技術スタック
データの保存方法
4.7 アクセスレイヤー構築の技術スタック
セルフサービス時代のユーザーへのデータ提供
4.8 アクセス制御
アクセスレイヤーに対するアクセス制御
4.9 本章のまとめ
第5章 メタデータ管理
データを管理する「データ」の重要性
5.1 データより深いメタデータの世界
データは氷山の一角
5.2 メタデータとデータ
3つのメタデータを整理/整備しよう
5.3 データプロファイリング
データの状態を見る
5.4 データカタログ
手元にないメタデータはカタログ化しよう
5.5 データアーキテクチャ
リネージュ,プロバナンス。メタデータの総合力
5.6 本章のまとめ
第6章
データマート&データウェアハウスとデータ整備
6.1 データを整備するためのモデル
DIKWモデル
6.2 データマートの役割
「Data」を整備して知恵の創出をサポートする
6.3 スキーマ設計
データに関するルールを設計する
6.4 データマートの生成サポート
コミュニケーションの省略&活用
6.5 データマートのプロパゲーション
メタデータやルールの作成
6.6 ストリーミングとデータマート
瞬時にKnowledge化する
6.7 本章のまとめ
第7章 データ品質管理
質の高いデータを提供する
7.1 データ品質管理の基礎
データ蓄積から次の段階へ進む
7.2 データの劣化
データは放置するだけで劣化する
7.3 データ品質テスト
劣化に気づくための品質チェック
7.4 メタデータ品質
生産性を向上させるために
7.5 データ品質を向上させる
品質テストの結果を活かす
7.6 本章のまとめ
第8章 データ分析基盤から始まるデータドリブン
データ分析基盤の可視化&測定
8.1 データ分析基盤とデータドリブン
エンジニアもデータドリブンに行こう
8.2 データドリブンを実現するための準備
データ分析基盤のPDCAと数値
8.3 KPIをどのように開発に活かすのか
データ分析基盤の「コスト削減KGI」の例
8.4 データ分析基盤観点のKGI/(CSF)/KPI
改善の着眼点
8.5 本章のまとめ
Appendix [ビッグデータでも役立つ]RDB基礎講座
A.1 データベースとは何か?
検索,更新,制約機能を持った入れ物
A.2 RDBの基本
データベースの基本を振り返る
A.3 RDBにおけるアーキテクチャ
RDBの設計
A.4 Appendixのまとめ