075 PyCaret, ML Study Jams Vol.4
2020年5月1日20時10分から
kerneler.icon質問や感想は以下のマシュマロよりください
いただいた質問はや感想は、放送で紹介します
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。
kerneler.iconお題
5月の目標
regonn.icon
ML Study Jams Vol.4 で8コース修了する
チューターとして参加するので、なるべく多くのコースに触っておいたほうが良いなというのと、まだ公式発表ではないけど、YouTubeでの説明会で8コース以上修了していれば、過去の ML Study Jams の余っているプレゼントも貰えるとの噂
ボートレース・Bot・Numeraiで利益を出す
FI 2.0 を目指して
並行で進めているので、並行で達成しそう
最近日本人で Numerai やっている人が増えた気がする
KaggleのAbstractionコンペでメダルを取る
currypurin.icon
Kaggleをやる
ウォルマートコンペ
TReNDSコンペ
本を読む
線型代数
モザイク除去から学ぶ 最先端のディープラーニング
ゼロから作るDeep Learning ❸
リスナーからの質問
https://gyazo.com/866d42a57ef2a0eff34b0739e4842f33
前提として、私currypurin.iconはあまり参考にならないかもしれません。
専業Kagglerの時点で時間も取れるし、取らないなら専業Kagglerやめるし
捻出できるかどうかは、それぞれ事情があると思うので、一般化が難しい...
捻出したあとは、とにかく集中できる環境を整えるのが良いと思う。集中という意味で1番は、自分が興味を持てることを見つけることかな。興味を持てないことやるのは、時間の無駄ですし。
その前提での回答は、以下
まずは現状把握が大切だと思います。
自分がどれくらい、自分の時間を取れているか
その時間を、どう使っているか
自分がその時間でどのぐらいのアウトプット出せるか
自分が出したいアウトプットのためにどれくらいの時間が必要か
必要な時間と、時間が取れている時間にギャップがある場合
解決する
家族に頼む
仕事を調整する
解決しない
時間の捻出が難しい場合は、今の時間で頑張る
必要な時間は取れているが、出せるアウトプットを出せていない場合
原因分析→改善
https://gyazo.com/3c424c84b560d9bf4164855f35ed3393
今年はゴールデンウィーク中にやるみたい
4つのコース修了でTensorFlowカップがもらえる
regonn.icon はチューターとして参加するので、質問とかにも答えるかも
チューターだとTensorFlow丼がもらえるみたい
PyCaretを動かしてみた
タイタニック
開催中のコンペでも公開されていた
Kagglerとしての使い所
小さいデータで、よくわからないデータとかであれば、手間もかからないので動かしみても良いかも
可視化は、自分で書くと面倒なので、引数に指定するだけでやってくれるのは便利
コード
分類だけでも8000行以上ある
メンテナンスが大変そう
今週のKaggle
新コンペ
特徴数も少なく、数値、自然言語、画像が扱える、良いコンペかも
やりたいことがわかりやすい