教養としてのデータサイエンス
履修を検討しているみなさんはよく目を通してください
科目情報
2023年度後期
東京都立大学 教養科目(科学・技術・産業)
月曜2限
教室:1号館220
【注意】持ち込みPCが必要です
■本授業のねらい
この授業では、「データリテラシー」を現代的教養として身につけることをめざします
データを科学的に取り扱い適切に活用することの重要性
データを分析・可視化するためのツールを適切に用いるために手法の原理や特徴、さらには限界等を理解
データを科学的に扱うためのセンスを養うことが必要
■「教養としての」の意味
誰もが理解しておくべきデータリテラシー
データリテラシーの有無は、データに溢れた現代を生きるうえで大きな差を生む
そのような意味での「現代的教養」
先端的に活用されている少し進んだ内容
機械学習のエッセンス
現代のテクノロジーに対する地に足の着いた理解
広く「学ぶこと」や生活・仕事に応用が効く概念
よりよく学び、よりよく生きるうえでの基盤的な素養、という意味での「教養」
■本授業の到達目標
到達目標①:データを見る力
データを科学的に扱うための統計的なものの考え方を身につけ、実際の例においてこれにもとづいた適切なデータの見方ができるようになる。
到達目標②:データ分析の基礎スキル
広く普及したツールを用いて、データの分析・可視化の初歩的な実践ができるようになる。
到達目標③:学びや生活との接続
データサイエンスで用いられる概念の本質を理解し、広く自身の学びや生活に応用できるようになる。
■具体的な学習内容
データサイエンスを十分に身につけるためには基礎から応用までさまざまな内容を学習する必要がありますが(当然ですが1科目では無理)、この授業では、以下の4つのテーマを取り上げます
データを扱うための基本中の基本と、データ分析の基礎的手法・応用的手法の体験をすることで、「現代的教養」としてのデータサイエンスを体感し、今後の学習や生活・仕事につながる学びを得てもらいます
4つのテーマは以下の通り
データを扱うための基本中の基本
テーマ① グラフ等によるデータの可視化(ビジュアライゼーション)
テーマ② データの分布と数値要約(代表値・散布度等)
テーマ③ データの相関(相関係数、相関と因果、擬似相関等)
データサイエンスの応用的手法の体験
テーマ④ 機械学習(ニューラルネットワーク等)
■本授業の特徴
本授業は、ちょっと(かなり?)普通の授業と違うかもしれません……
知識を得て、さまざまなことができるようになることは、本来楽しいものです
しかし、その楽しさを味わうためには、話を聞くだけではなく、学習者自身が「前のめりに」学ぶことが重要だと考えています
本授業では、これをめざして、以下のように大きく2つの特徴を持つ学び方にもとづく授業を設計しています
《本授業の特徴1:知識を自分たちで構築し、共有する》
講義を聞いて、機械的に板書を写して、試験前に覚えて、試験で吐き出す。そして試験後はすべて忘れる……。この授業はそういう授業ではありません
知識を「覚える」だけでなく、実際の場面で使えるようになることをめざします。そのために、以下のように大きく2種類の学習活動を行います
学習活動①:必要な知識を自分で調べて、自分なりに整理する(オンラインノート作成)
聞くだけ・写すだけではなく、自分で整理し文章を書く(外化する)、という行為が知識の定着を促します
すでに学んだことがあり、「知ってるつもり」のことであっても、あらためて外化することで、理解のあいまいさ・不十分さが見えたりします
具体的には、ScrapboxというWebシステムを使って、「自分だけのオンラインノート」を各自作ってもらいます(使い方は第2回に説明) 物理的制約があり検索性に乏しい紙のノートではなく、ネットにつながっていればいつでもどこでもいくらでも記録、編集、閲覧ができるWebシステムであることがポイント
この授業が終わっても、必要に応じて容易に参照し続けることのできるオンラインノートを作成します
作成中のオンラインノートは、クラス全員で(匿名で)オンライン上で共有します
よいものはお互いに参照(リンク)し合うことができます
疑問に思うものは意見交換し、クラス内で質を高めていきます
オンラインノートの例
上がオンラインノートのトップページ、下が各ページです。
要するに、簡単に作れる「自分だけのWikipedia」のようなものをイメージしてください
https://gyazo.com/cd6a914437e48bc2cc346c9010d6e3d4
https://gyazo.com/2981c4f0c24ef9850b957edf7d3e45d4
学習活動②:作成したオンラインノートをもとに、具体的な演習課題に取り組む
4つのテーマに対して、テーマに関連する知識を自ら調べてScrapboxのオンラインノートにまとめ、これを用いて演習回での演習課題に取り組みます
いわば、オンラインノート作成で得た知識(武器、アイテム)をもとに演習課題(中ボス)に取り組む、といったイメージ(第15回の最終課題はラスボス)
作ったオンラインノートが充実しているほど、よい解答ができるようになるでしょう
演習課題の多くは、答えのない(1つに定まらない)問題です
この演習課題の解答も、クラス全体で共有します
本授業はあくまで個人での学習が基本ですが、上のように、Scrapboxの特性を活かして、オンラインで学習成果をシェアしたり、協同学習を行ったりして、クラス全体での学び合いをめざします
まとめると、下の図のような学習活動を行うことになります。これを4つのテーマそれぞれ、授業3回分程度をかけて行います
本授業はあくまで個人での学習が基本ですが、Scrapbox等のオンラインツールの特性を活かして、オンラインで課題の解答や学習状況をシェアしたり、協同学習を行ったりして、クラス全体での学び合いをめざします
https://gyazo.com/9661d4fa4fd7268181b0819f28142a5f
https://gyazo.com/de45ab1ff31b8e2ae05e28f7b2275c7d
《本授業の特徴2:楽しみながら学ぶ》
いつでも、どこでも取り組める:Webシステムによる学習
Scrapboxは、ネットにつながってさえいれば、PCでもスマホでも編集可能です
何かよい本をみつけたり、よいWebページをみつけたり、何かを思いつたりしたときに、すぐその場で編集することができます
学びの場が常に手元にあるので、「面白い!」と思ったらモチベーションを失わずにすぐ作業に取り掛かることができます
なにより、こうした新しく優れたツールは、使うことそのものが楽しい体験になるでしょう
学習のプロセスと成果の可視化:ポイント制
オンラインノートの作成状況、演習課題への解答など、学習のプロセスと成果をポイント化します
ポイントは、学習のプロセスと成果を定量化したものです
いまどの程度のポイントを獲得できているかを一覧にまとめ、常に見ることができるようにします
なにがいまどこまでできているのか? 次は何をすべきか? ということを、ポイントの現況をもとに自ら計画できます
これ自体が、自分の学びのモチベーションになるとともに、後述のように成績評価にも用います
■本授業の進め方
上に書いたように4つのテーマを設定し、3回ほどで1つのテーマについて取り組みます
各テーマについて、調べ学習&オンラインノート作成 → オンラインノートシェア → ベーシック課題への取り組み → 課題のシェア&解説 → スペシャル課題への取り組み → 課題のシェア&解説、というサイクルを繰り返します
15回の流れは下の図のようになります
https://gyazo.com/7f5c7b6ff951d4e7e1b4c5632efe90b7
学習のためのツールについて
授業内・授業外ともに、学習活動には主にScrapboxを使用します
また、演習ではMicrosoft WordおよびExcelの使用を基本としますが、これ以外のツールやプログラミング等により課題を行うことも可能です
ScrapboxやGoogle系サービスの使用のためにGoogleアカウントが必要です
オンラインノート作成について
演習課題に取り組むための前提知識をまとめるため、各テーマについて調べ学習を行い、Scrapboxでオンラインノートを作成します
各テーマの最初の週の授業外課題で行います
もちろん、それ以外の週も随時オンラインノートを更新していって構いません
Scrapboxの使用方法は第2回授業で説明しますが、より進んだ使い方を自分自身で工夫しても構いません(むしろ推奨します)
演習課題について
演習課題は授業中に発表し、授業中に取りかかり始めますが、終わらないぶんは授業外学習として完成させ、オンラインで提出します
演習課題は、全員必須のベーシック課題と、より進んだ内容に取り組む任意のスペシャル課題を用意し、上の図のように、週ごとに出題し、次の週の前半にそのシェア活動を行います
自身の関心・意欲・状況に応じて、取り組む量を自ら決定してください
学習量は、ハッキリ言って「多い」と感じるかもしれません
自身の目標に応じて、相応の量の学習を積極的に重ねる必要があります
しかしそれも、ポイントの情報をもとに、どこまでの学習成果を得たいかによって、どれだけの学習を行うかを自ら決定することができます
ただしすべての学習成果はデジタルデータとして授業後も活用できますので、取り組んだぶんだけその後の自分自身の学習に資することになります
■成績評価方法
4つのテーマそれぞれの内容の学びの度合い、および情報活用能力・総合的問題思考力・能動的学習姿勢の本授業での発現の度合いを評価します
具体的には、提出された演習課題、およびScrapboxにおける学習活動プロセスのようすをもとに、これらの要素の達成度合いをポイント化し、最終的な成績はこれをもとに総合的に評価します
ポイントの状況はオンラインで常時公開し、いつでも確認できるようにします
ポイントと成績の対応など、成績評価の詳細は第1回授業において示します
■参考書
購入はマストではありませんが、大いに参考になる書籍です。図書館等でもいいので、読んでみるとよいでしょう
江崎貴裕, 「分析者のためのデータ解釈学入門」, ソシム, 2020.
吉田寿夫, 「本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本」, 北大路書房, 1998.(テーマ①~③に関連)
松本健太郎, 「グラフをつくる前に読む本」, 技術評論社, 2017.(テーマ①に関連)
藤俊久仁, 渡部良一, 「データビジュアライゼーションの教科書」, 秀和システム, 2019.(テーマ①に関連)
東京大学教養学部統計学教室(編), 「基礎統計学Ⅰ 統計学入門」, 東京大学出版会, 1991.(テーマ①~③に関連)
伊庭斉志, 「進化計算と深層学習―創発する知能―」, オーム社, 2015.(テーマ④に関連)
これらはあくまでごくごく一部です。その他多くの良書があります
この授業を通してこれらを発見し、クラス内で共有していきましょう
■オフィスアワー
オフィスアワーとして特定の時間の設定は行いませんが、質問・相談は随時受け付けますので、まずはメールで連絡してください。(連絡先: kondo<at>tmu.ac.jp(<at>を@に変換))