019.使ってるツール
2019年1月25日
もう少し詳しくという要望があったので、前回に続きもう一度
kaggleで銀メダルを取るのは難しいと思う
「銀メダル安定までに4年かかった」というツイートがあった
一方で、「全期間(約3ヵ月)公開カーネルをしっかり読んで真面目に参加すれば取れる」とのツイートも
全期間、公開カーネルをしっかり読んで理解するのは、はじめのうちは時間がかかって難しいけれど、慣れてくるとやっていることがわかるようになるので時間がかからなくなる
テーブルデータのコンペと画像データのコンペは別物(一部共通点もある)
テーブルデータの場合は、kaggleのソリューションからほぼ全てを学ぶことができる
LightGBMなど、ツールのドキュメントは読む必要がある
画像コンペの場合は論文を読むとか、強い人に教えてもらうとかする必要がある
画像データのコンペはディープラーニングが必須だと思う
テーブルデータのコンペはLightGBMだけでも戦える。
戦えるが、NN系とアンサンブルすると更に強くなる
チームマージは本当にお勧め
チームマージするデメリットはほとんどない
お互いのモデルのアンサンブルでスコアが改善する
テクニックを交換できる
チーム戦は楽しい
カレーちゃんは本を書く時にどんなツール使ってる?
reviewは使わずにPages(appleのワープロソフト)で書いています
Pagesの良い所
図や写真のレイアウトが簡単。好きな場所に挿入できる。
簡単に他の人にレビューしてもらえる(共有できて、コメントもしてもらえる)
共同作成も可能
reviewの使い勝手
gitで差分を管理できるので、複数人でインタラクティブに書くならreviewなどのツールは必須だと思う
1人で書くとか、章ごとに分担して書くとかなら、PagesやWordの方が図や写真を自由にレイアウトできるなど使いやすい点もある
plotライブラリは何使ってる?
Kaggle Python Dockerにあるもの(れごんがわかる範囲で)
ストレングス・ファインダーの結果をJuliaで主成分分析して似た人を探す
初めて機械学習関連の仕事がもらえそう(れごん)
詳しくは話せないけど、3月納品で納品物は公開されるのでそこで話せそう
kaggleの講師をすることになりました(カレー)
noteでお仕事依頼を書いていたら、声をかけてもらえた 東京でkaggleもくもく会の開催が告知されていた
今週のkaggle
れごん
引き続き解析ノート更新
やっとグラフ表示ぐらい
コメントと up vote もらえてる
読んでるカーネルの表記が間違ってるところをコメントで指摘したり
kernel と discussion で銅メダル1枚ずつもらえた
カレー
Eloコンペに主に取り組んでいる
あまり印象が良くないコンペだったが、取り組んでみて良いコンペかもしれないと思った
オレシカナイト用のコードの準備もした