10年戦えるデータ分析入門
https://gyazo.com/7c6ee809e788d2cc87f1672037aa21ea
評判よかったけど SQL の話が思ったより多かった
UNION ALL で null 埋め
支持度・リフト値
scalar subquery
self join して去年との比較
Window 関数で ntile(10)
セッション分析、lag でセッションの開始フラグ(1)を作って累積和してセッション数にするやつ
DWH
利用者には自由を与え、構築者にはルールを与える
要件
サブジェクトごとに編成されている
データが統合されている
時系列データを持つ
データが永続する
現在時刻から集計するタイプは mart に置きたいなあ
未来のデータが混ざってしまうのを避けるために現在時刻より過去でフィルタするのはまあいい
その後