105 MoAコンペを終えて
2020年12月7日20時10分から
kerneler.icon質問や感想は以下のマシュマロよりください
いただいた質問はや感想は、放送で紹介します
このポッドキャストでは、恋言とカレーが、Kaggleなどのデータサイエンスに関連する情報、新しい働き方、量子コンピュータ、xR等について話します。
kerneler.iconお題
MoAコンペ終了
115位で銀メダルだった。
コンペの概要
薬が投与された後の細胞の生存率等のデータ特徴
薬は採点対象で207種類、採点対象外で400種類ある。
207種類の薬について、飲んでいる確率をそれぞれ提出
log_loss
薬Aと薬Bを飲んでいるなど、複数の薬を飲んでいることがある
薬の組み合わせは5000種類あると概要にあり、trainには約3700の組み合わせがあるので、testにはみたことがない薬の組み合わせが1300あることがわかる
自チームのモデル
stiratified Kfold & ディスカッションで共有されていたGroupKfoldとStratifiedKfoldを合わせたバリデーション
MLP & Tabnet
上位のsolution
target(薬)毎に学習時のロスを確認し、ベストなエポックのモデルを使う
Bengaliの復習的な内容です。L2 Softmax-> コサイン類似度でseen/unseenを分離して、seenには通常のマルチラベル層化抽出でガッチリfit、unseenにはGroupKFoldでロバストに、と言った具合です。pseudoは使ってないですよ。 tweet アドベントカレンダーで書いた記事
今年の強化学習のコンペティションと強化学習フレームワークについてまとめた
別のアドベントカレンダー記事だけど、強化学習のHaliteコンペに書かれた記事が炎上している
Numerai Signals 用に Kedro でパイプラインを構築した話
今後も外部データ管理とか増えてくると思うので、今のうちに Kedro に乗せてコード・データ管理ができるようにしておきたい
11月の目標結果
currypurin.icon
MoAコンペやる🔺
やれたけれど、金メダル獲得ならず
Kaggleのチュートリアル第5版の準備❌
手をつけられなかった
最新研究からわかる 学習効率の高め方 読む❌
未読
splatoon2をやらない⭕️
目標達成できた
regonn.icon
朝の散歩と夕方の筋トレを日課にする❌
スマホアプリを一つ公開する❌
solafuneとかのコンペに取り組んで、衛星画像についての記事を書く❌
システムトレードが動いているかの確認だけにする(チャートを見ない)
値上がりでロット調整の必要があったけど、今はできている ⭕
12月の目標
currypurin.icon
Kaggleのチュートリアル第5版公開
cassava コンペとrainforest コンペを進める
regonn.icon
確定申告の準備をしてしまう。10月分まで月締めできるように。
Kaggleのコンペに週10時間は使えるように予定を調整
今週のKaggle
MoAコンペ終了
Numeraiっぽい
電車のある地点までの運行データから、その後の電車の遅延時間を推測する
1月21日まで