特徴量engineering
新たな特徴量を生成する作業
主に説明変数に対しておこなう
データの性質を見ながら、試行錯誤して行う
Data Scientistの力量が問われる
職人芸だ!takker.icon
作業を行う前にdata cleaningしておく
単一表
単一行
単一変数
数値
この当たりは単なる変数変換だな
二値化
離散化
分位化
対数
べき数
スケーリング
カテゴリ
encoding
ビンカウンティング
複数変数
交互作用
単なる複数変数間の四則演算?
主成分分析
特異値分解
クラスター分析
複数行
その他
FFT
Graphical Lasso
別モデルの予測値
複数表
要は変数変換をやっているということか?
目的
機械学習モデルなどの精度向上
Reference
今あらためて考える特徴量エンジニアリング ~予測精度をあと一歩改善するテクニック - アイマガジン|i Magazine|IS magazine
#2021-04-29 16:36:26