特徴量engineering
新たな
特徴量
を生成する作業
主に
説明変数
に対しておこなう
データの性質を見ながら、試行錯誤して行う
Data Scientist
の力量が問われる
職人芸
だ!
takker.icon
作業を行う前に
data cleaning
しておく
単一表
単一行
単一変数
数値
この当たりは単なる変数変換だな
二値化
離散化
分位化
対数
べき数
スケーリング
カテゴリ
encoding
ビンカウンティング
複数変数
交互作用
単なる複数変数間の四則演算?
主成分分析
特異値分解
クラスター分析
複数行
その他
FFT
Graphical Lasso
別モデルの予測値
複数表
要は変数変換をやっているということか?
目的
機械学習モデルなどの精度向上
Reference
今あらためて考える特徴量エンジニアリング ~予測精度をあと一歩改善するテクニック - アイマガジン|i Magazine|IS magazine
#2021-04-29
16:36:26