公開カーネルをコピーしてサブミット後にやること
質問
初めてコンペ参加しました。
公開ノートブックをベースにして、サブミットしてみましたが、
これから何をすればいいか分からなくて、挫折しそうです。
何かアドバイスなどありませんか?
答え
初コンペで、機械学習なれていないということですかね。
だとすると、さらに公開ノートブックを色々と読んで行くと良いと思います。
自分がベースにしてサブミットしたものと、upvoteが多くついているやつをいくつか読んでみて、やっていることをなるべく理解してみましょう
わからないことは、メモしておきましょう。(メモしておくと、他のノートブックを読んだときに、また出てきたり、そのことがなんとなく分かったりすると思います)
色々と公開ノートブックを読んで、自分のベースのサブミットではやっていないことがあれば、ベースに取り込んでまたサブミットすると良いと思います。
後、もう一つやっておいておいた方が良いのは、評価指標の理解(とvalidationを考えること)です。
評価指標は、どうして主催者がその指標にしたかとか、その指標のメリット・デメリットとか考えると良いと思います。
よく使う指標は今後も別のコンペや実務で使いますし、特殊な指標などはハックできることもあるので、いずれにせよ力を入れて取り組むと良いと思います。
評価指標によって、どのようにvalidationを考えるかに発展することもあるので、その場合もvalidationも本やブログを読んだりして勉強しましょう。
ここまできた段階で、初コンペだと期限ギリギリかもしれません。ここで終わっても初コンペだと良いと思います。コンペ後の復習を頑張りましょう。
その他、もっとできる場合は、次のことなどが候補だと思います
Kaggleで勝つデータ分析の技術本を読みつつ、特徴量を作ったり、validationを考えたりする
discussionやnotebookで、議論する
notebookをkaggleで公開して、強い人から意見をもらう
書籍
ツイート