discussionのsolutionの活用
質問
こんばんは。
本日「kaggleスタートブック」を購入し、kaggleを触り始めた者です。
(機械学習系の学習歴は1年程度)
過去コンペの活用について、ご相談させてください。
私は当初、
過去の優勝コードの写経を通して、一流の方々の一連の分析技術を盗めたら、と考えていました。
しかしながら、
discussionにて概要紹介はあるものの、
実コードがほぼ公開されていないように見受けられました。
※Notebookにて非上位者のsubmitソースが一部拝見できることや、
下記サイトなどに、一部まとめられていることは確認しました。
https://ndres.me/kaggle-past-solutions/
こうした経緯を踏まえた上で、kaggleをどう活用するのが効率的でしょうか?
私が知らないだけで、どこかでコードが公開されていたりするのでしょうか?
個々のテクニックなどは、「kaggleで勝つ~」などで習得予定ではいるのですが、
一連のお手本的解答をもとに学習したいな、と感じているところです。
お手数ですが、ご教示の程、よろしくお願いいたします。
答え
そのコンペでどうしてその手法を使ったかとか、効果的だったかの方が重要で、discussionはそれをみると良いと思います。次のブログが参考になると思います。
https://blog.regonn.tokyo/data-science/2019-12-01-kaggle-sutra/
コードは上位者と下位者で大きな違いがないことが多いですし、kaggleで手法名で検索すれば、実装が出てくることが多いと思います。
コードやdiscussionのsolutionも善意で公開されているので、どこかに必ず公開されているということはありません。githubなど探せば公開されていることもあります。
また、kaggleをやることにより、何を身に付けたいのかは人それぞれなので、それを教えてもらうと回答をしやすいと思います。
slack
https://kaggler-ja.slack.com/archives/C6RV8M3DG/p1600515853021500
#質問と回答 #kaggler-ja