TabNetについて
なんで書いたのか
GCPのAI Platformに一アルゴリズムとして導入されたので気になった
In particular, TabNet’s design considers two key needs: high performance and explainability.
ブログや論文曰くニューラルネットワークと勾配Boostingのいいとこどりらしい・・・ホントかよ
TabNet on AI Platform: High-performance, Explainable Tabular Learning
ここまで書かれると今後コンペや業務の標準解法に使われる可能性もあるのかなと思ったから
読む前の疑問点
この論文の肝であるモデルの説明性、feature_importanceの計算はどうやっているのか
欠損値はどう扱うのか、事前にこちらで前処理する必要あり?
概要
実装
非公式実装はsklearn-apiを踏襲している
https://github.com/dreamquark-ai/tabnet
unofficial
PyTorch
feature_importanceあり
https://github.com/titu1994/tf-TabNet
unofficial
Tensorflow2.0
https://github.com/google-research/google-research/tree/master/tabnet
official
Tensorflow1.x ?
参考
https://arxiv.org/abs/1908.07442