074 求められるデータサイエンティスト人材像
2020年4月24日20時10分から
kerneler.icon質問や感想は以下のマシュマロよりください
いただいた質問はや感想は、放送で紹介します
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。
kerneler.iconお題
4月の目標結果
regonn.icon
Twitterを4月中はやめる ⭕
ボートレースの自動ベット機能を構築 🔺
分析段階
ここもPyCaret導入中
KaggleのAbstractionコンペで月末にメダル圏内に入れるようにする❌
一番後回しになってしまった
Flutterでアプリを作る🔺
ジムでの筋トレアプリを作ってたけど、コロナの影響でジムに行かなくなって使わなくなってドックフーディングができない状態になっている
は公式のFlutterチームが作成していて、結構参考になる
曲を1曲作成⭕
Magenta Studioの複数の機能を組み合わせてミニマルミュージックを作ってる
作業終了時間を早めたため、全体的に達成できていない部分が大きい
来月は3つぐらいに目標を減らしてみる
currypurin.icon
自宅の作業環境を整える⭕
昇降デスク、ステッパー、本棚など整えた。あとはブログに書く
Ionコンペ、ウォルマートコンペ(2つ)やる⭕
毎日取り組めている
就職活動終了⭕
面接終了して結果待ち
本を読む(時系列本・100本ノックなど)🔺
Python実践データ分析100本ノック(秀和システム)は読了
時系列解析(共立出版)はまだ読めていない
サークルを盛り上げていく🔺
途中から毎日本を読んだメモを公開したりした
タイタニックの次のコンテンツとして、不動産価格予想を作ろうとしている
リングフィット アドベンチャーを入手する❌
抽選に応募するなどしているが落選。入手は難しそう
現在企業に求められている人材が見えてくる
ざっくりまとめると
現状の企業に在籍するデータサイエンティストは、データエンジニアのような大量のデータを収集・加工・分析・運用するデータサイエンティストが多い
今後はデータ収集やツールが整ってきて、その先のデータからビジネス課題を見つけ出せることができる人材
Kaggleでどう活かせるか
Kaggleに取り組むことで、「複数の分野を俯瞰的にみてデータ分析の活用を戦略的に考えられる人材」を目指す?
u++さんがゲストのときに言ってたようなこと
質問箱の答えをまとめた
同じような質問も多くて、自分でも探しにくかったのでまとめた
読書猿さんが同じようにscrapboxでまとめていたので参考にした
早くコードを書いたりnotebookを理解するためどうしたら良いですか
https://gyazo.com/2e66b8c0f07894072c4f45f8f7c99d1c
currypurin.iconも遅いのでどうしたら良いか、悩んでいる
kaggleスタートブックの次に求められるコンテンツ
https://cdn.discordapp.com/attachments/620778693907972096/702316970711973928/2020-04-22_09.35.18.png
SIGNATEのマイナビコンペをやると良いんじゃないか。
今週のKaggle
新コンペ
評価指標:QWK
Notsbooks-only competition、External dataあり・外部トレーニング
7/22期限
1日3サブ制限、最終サブ2つ
データサイズ(193 GB)
feature-weighted, normalized absolute errors
6/29期限
1日3サブ制限、最終サブ2つ
データサイズ(164GB)