データサイエンス
#概論
データサイエンス
データサイエンスという語の定着
主に統計学やデータマイニング、機械学習等による「データ」を対象とする(実践に近い)学問
「ビッグデータ」とともに「データサイエンティスト」がバズワード化
データサイエンスを学べる大学(学部)も増加中
同様に「機械学習・AI」のブーム
ディープラーニングの登場
機械学習・AIのコモディティ化
「データから法則性を自動的にみつける」しくみ
音声認識、画像認識、推薦システム、自動運転、AlphaGO、Siri、、、実用化は枚挙に暇なし
最近は大規模言語モデルの発展が著しい
データサイエンスとは(参考:濵田・狩野「データサイエンスの基礎」(2019))
Donoho(2017)は以下6項目の結合として定義
(1) Data gathering, preparation, and exploration(データの収集、前処理、調査や吟味)
(2) Data representation and trandformation(データの表現や変換)
(3) Computing with data(データを用いた計算)
(4) Data modeling(データに対するモデリング)
(5) Data visualization and presentation(データの視覚化とその説明)
(6) Science about data science(データサイエンスに関連する科学)
データサイエンスは総合的な取り組み
数学的知識、計算機技術、対象となるドメイン知識のすべてを必要とする
Drew Conway(2013)によるデータサイエンスのベン図
https://gyazo.com/e75f347db10c0e0fcdb41c5ec71ab562
図の引用:濵田・狩野「データサイエンスの基礎」(2019)
世の中の流れ
AI戦略2019(内閣府)
https://gyazo.com/bf9f3d8584bbff1c0c1d8c3c38df3dd9
図は「AI戦略2019【概要】」(2019年7月)より引用
数理・データサイエンス・AIモデルカリキュラム
「AI戦略2019」をふまえ、数理・データサイエンス教育強化拠点コンソーシアムによりリテラシーレベル、応用基礎レベルが策定
以下は「リテラシーレベル」のモデルカリキュラム
https://gyazo.com/d28d269fa2e8aa3d4d2749b5f25b064a
図は「数理・データサイエンス・AIモデルカリキュラム」(2020年4月)より引用