DWHにおけるデータモデリングとその歴史
前提
変わらないSQLとリレーショナルモデルの重要性
しかし、これらの根本を支える技術として、不変のものもある。
NoSQLやデータレイクの流行によって隅に追いやられていた時代もあったが、データを分かりやすく扱う上で未だにリレーショナルモデルとSQLを超える技術は生まれておらず、近年SQL重視の傾向はますます強まっている データ基盤における性能・コストの変化
データ基盤をどう作り、どう提供するかの設計は重要
データの量が増え、価値が高まっていっている現代において、そのデータをリレーショナルモデルとしてどう蓄積し、どのようなSQLでアクセスするか。つまりどんなデータモデルを作るかという技術(データモデリング)は、その価値が再発見されつつある、今まさに重要な技術と言える
--.icon
DWHの誕生と発展に貢献した二人の偉大なアーキテクト
DMBOK(データマネジメント知識体系ガイド)第一版の9章「データウェアハウジングとビジネスインテリジェンス管理」では、以下のような書き出しでデータウェアハウスについて説明を始めている データウェアハウスについて解説する場合、どうしても避けて通れないふたりの名前がある。それが、Bill InmonとRalph Kimballである。このふたりの著しい貢献により、データウェアハウスの実践的な技術が発達し、形成された。 ― DAMA International『データマネジメント知識体系ガイド』(2010)p.200
これら二人の提唱したアーキテクチャの違い
Bill Inmon
きれいに正規化された全社的なハイレベルデータモデルを設計し、それをもとにミドルレベル、物理レベルのデータモデルを作っていくというトップダウン的なアプローチを提唱 https://gyazo.com/9697782763a81bf3262ab6edb503a965
また、コーポレートインフォメーションファクトリーと呼ばれるデータプラットフォームの全体概念を提唱した
今から20年以上前に描かれたにも関わらず、現代のデータプラットフォームを説明する図(例えばNTTデータのビッグデータリファレンスアーキテクチャ※関連記事リンク参照)とも非常に似通っており、データプラットフォームの全体像を把握するのに役立ちます。
https://gyazo.com/9ae3741daa7080188adaa9099c6258e7
Ralph Kimball
データの利用や分析を出発点としたボトムアップ的なアプローチを提唱
ビジネス的な要求やクエリパフォーマンスに焦点を当てた現実的なアプローチであるとも言える
https://gyazo.com/787c36fb2bc0b6df6e085b65ca3d0529
https://gyazo.com/60845f7edaa50fb29e4f076c547eeb32
--.icon
クラウドDWH時代の最新データモデリング
https://gyazo.com/3a5ad0f5d42581e3f56033f02ffb996b