099 Pythonで動かして学ぶ!Kaggleデータ分析入門 レビュー
2020年10月19日20時10分から
kerneler.icon質問や感想は以下のマシュマロよりください
いただいた質問はや感想は、放送で紹介します
このポッドキャストでは、恋言とカレーが、Kaggleなどのデータサイエンスに関連する情報、新しい働き方、量子コンピュータ、xR等について話します。
kerneler.iconお題
衛星データ解析コンテストプラットフォーム
現在は衛星画像を利用した航空利用者数を予測コンテストが開催中
著者の篠田さんと、対談をした
この本の対象読者は、「Kaggleスタートブックよりも、さらに入門レベルを想定している」
Expertが書いた、Kaggleの入門書としての特色を意識している
良いところ
Titanicコンペと、House Pricesコンペにどのように取り組むか詳細に書かれている
Kaggle Masterへのインタビューや、私が去年の12月にKaggle days Tokyoでの登壇が書かれていおり、実際のコンペについてイメージしやすい
この本を読んだ後に、どのコンペに取り組むと良いかおすすめと、参考にするnotebookが書かれている
Predcit Future Salesコンペ、PUBG Finish Placement Predictionコンペ、IEEE-CIS Fraud Detectionコンペ
GCP AI Platformの使い方の説明がある
この本では足りないところ
Kaggleのスタートブックの脚注のような、これまでの多くの知見へのリンクはないので、他でしる必要がある。
リスナーからのメッセージ
@regonn_curry @currypurin 放送第一回からのリスナーです。#regonn_curry_fm に触発されて、ついに自分でもポッドキャストを始めました。お二人のように100回近く放送できるように頑張ります!
Zoomでの収録システムとかAnchorでの配信とか色々参考にさせていただきました。先輩、これからも宜しくおねがいします!
今週のkaggle
KaggleのNotebookのviwer pageの改善点を、Discussionで募集している
現在のところ寄せられている主な改善点
outputが長いセルは、省略して欲しい・省略できるようにして欲しい
データソースが複数ある場合に、multiple data sources ではなく、主なものを表示して欲しい
ページビュー数から、作成者が見たページビュー数を除いて欲しい