データ戦略の策定と実践
データ戦略の策定と実践
データの活用計画をつくる
2 つの変化の機会
クイック・ウィン型
大規模デジタルトランスフォーメーション型
ブレインストーミングでデータ活用計画の案を出す (どの案も企業の進歩につながる 6 種類のデータ活用目的のいずれかにあてはまること)
案ごとにデータ活用テンプレートを埋める
戦略目標に整合することが重要 (自社のニーズがわかっていればよい)
鍵となる質問
効果測定の方法を決める
責任者を決める
顧客 (データ利用者) が誰かを明確化
必要となるデータを洗い出す
目的達成に必要なスキルとリソース
データ戦略を策定
大規模トランスフォーメーション型が 1 ~ 5 程度、クイック・ウィン型が 1 ~ 3 程度
データ戦略テンプレートに沿って考えると良い
データのソース選びと収集
多くのデータが手に入るが、ほとんどがダークデータ
構造化データと非構造化データ、半構造化データ
内部データと外部データ
比較的新しい種類のデータ
アクティビティデータ
会話データ
画像・動画データ
センサーからのデータ
データガバナンスと倫理問題および信頼問題
AI の倫理問題
たいていは同意とプライバシーの問題に帰着
敵対的生成ネットワーク (GAN)
レコメンデーション技術における危険
フィルターバブル
透明性も重要
AI のブラックボックス問題、OECD が策定した AI 原則
AI が環境に与える影響
倫理委員会のような組織を設けることを薦める
クリーンなデータ
データの品質
データの偏りがないこと
法律
EU の一般データ保護規則 (GDPR)
カリフォルニア州の消費者プライバシー法 (CCPA)
中国の個人情報保護法 (PIPL)
個人データは何よりも大切
負担を減らすためにデータ最小化が重要
データ侵害
認証、暗号化、準同形暗号化
データの非特定化
マスキング
トークナイゼーション
徹底的で包括的なデータガバナンス戦略の策定が重要
データをインサイトに変える
相関分析 : 最も広く使われている分析技術
回帰分析
非構造化データからインサイトを引き出す
手動でどうにかする : タグを付与するなど、メタデータを構築する
画像・動画分析、テキスト分析、センチメント分析、音声分析
ノーコード AI、サービスとしての AI インフラ
IT インフラとデータインフラの構築
ここ数年で業界スタンダードになった分析サービス
HP の HAVEn 分析プラットフォーム
Salesforce の Einstein Analytics
Amazon Kinesis や IBM Cognos、Alteryx、Sisense、Teradata
フェーズごと
1. データの収集
2. データの保管
オンプレミスのデータウェアハウスかクラウドベースか、ハイブリッドか (ハイブリッド方式が一般的)
クラウドストレージ
データのサイロ化を避ける
3. データの分析と処理
一般に、MapReduce というフレームワーク
分析でもクラウドサービスが機能を提供
4. データの伝達
市販のデータ可視化プラットフォームもあり
QlikView と Tableau が代表的
M2M (machine to machine) がますます重要に
データ能力の高い組織をつくる
データサイエンティスト
最重要なデータサイエンススキル
データサイエンス等の学習用コンテンツ
データサイエンスのクラウドソーシングとしての Kaggle
データ戦略の実行と改善
戦略に沿った計画を考案したら、実行する前にプレモーテムをすると効果的
データ文化の醸成
参考文献
世界標準のデータ戦略完全ガイド データセンスを磨く事例から、データの種類と仕組み、戦略策定のステップまで