Kaggleスタートブックの次
質問
質問させてください。Kaggleスタートブックを読み終え、Kaggleで勝つ技術データ分析を読み進めております。並行して、SIGNATEの練習コンペをやっているのですが、特徴量エンジニアリングがうまくできないです。具体的には、LightGBMで分析し、重要度などをだすのですが、その次の一手(重要だと出た特徴量をどう使用するかなど)が思いつかない状態になります。何かオススメの本や資料などはありますか。
答え
コンペをやりながら、Kaggleで勝つデータ分析の技術を読むのが良いかもしれません。
例えば、今だと、SIGNATEの過去コンペに挑戦できるチャレンジがあるので、このチャレンジをしてみてはどうでしょうか。
このコンペは、上位のsolutionなども公開されているので、自分のモデルに何が足りなかったかとかコンペの進め方がわかると思います。
https://signate.jp/competitions/264
資料としては、Kaggleで勝つデータ分析の技術が良いと思いますが、そのほかには、同書やKaggleスタートブックで言及している資料(Kaggle Tokyo meetupの資料や過去コンペのsolutionなど)を見ると良いと思います。
書籍
Kaggleスタートブック
Kaggleで勝つデータ分析の技術
#質問と回答 #kaggler-ja #未完成