Kaggle
Adversarial Validation
kaggleでよく使う交差検証テンプレ(Keras向け)
「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見
2023-24年のKaggleコンペから学ぶ、NLPコンペの精度の上げ方
shake-upを科学する - Speaker Deck
今までにKaggleコンペで使ったLB Probing手法について
CV
【機械学習】CVスコアを理解する
【第4回】関東Kaggler会「The Correct Way to Use the Validation Score」 - Speaker Deck
Kaggle CLI
Getting Started on Kaggle | Kaggle
認証情報は ~/.kaggle/kaggle.json
サブコマンドは1文字目が alias になっている
kaggle datasets → kaggle d
-m, --mine で自分のものをリストに
$ kaggle kernels list -m
$ kaggle datasets list -m
他使いそうなもの
$ kaggle competitions list
$ kaggle datasets download -d <username/dataset-name>
$ kaggle datasets download -c <competition-name>
$ kaggle datasets metadata -d <username/dataset-name>
FastKaggle
Kaggleコンペ用のVScode拡張を開発した | ho.lc
効率的なコードコンペティションの作業フロー | ho.lc
code:kernelspec.ipynb
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"name": "python",
"version": "3.13.0"
}
},
GPU
https://gyazo.com/238c96eda75d78e0e0eb589892c9021f
実際何が使われてるんだ、P100 は bf16 使えないよね? → 見た範囲 LLM コンペでは T4x2 + vLLM が多い
TPUとKaggle
---.icon
Titanic チュートリアルやる
もう答えが出回っているからから Leaderboard 1.0 ばっかじゃん
Titanic Tutorial | Kaggle 眺める
gender_submission.csv は女性なら生存の出力ね
これに勝てないならショボショボのショボ
random forest
Titanic competition w/ TensorFlow Decision Forests | Kaggle
眺める
GBT ね
_ tfdf.keras.FeatureUsage
_ model.make_inspector().evaluation()
可視化できないのかな
Visualizing TensorFlow Decision Forest Trees with dtreeviz  |  TensorFlow Decision Forests
tfdf.tuner.RandomSearch でハイパーパラメータ調整
Automated hyper-parameter tuning  |  TensorFlow Decision Forests
Spaceship Titanic
Competition
Kaggle - LLM Science Exam | Kaggle
LLM キャッチアップによいかも
Colaboratory でやる
GitHub - Kaggle/kaggle-api: Official Kaggle API
Drive で kaggle フォルダを作り API キーを置いておく
code:kaggle.py
%env KAGGLE_CONFIG_DIR=/content/drive/MyDrive/kaggle
!pip install kaggle > /dev/null
from google.colab import drive
drive.mount('/content/drive')