特徴量 - bluemo-public

特徴量

情報科学の達人.iconパターン認識

表現法によって、特徴ベクトルの次元やパターンの分布も変化

ex: 画像を全ピクセルのベクトルではなく、

色合いのヒストグラムを特徴にする

形を特徴にする

行ごとの平均値を特徴にする

など、目的によって様々な適した特徴量が考えられる

認識にてきした表現を選ぶ必要がある

それを頑張るのが特徴量エンジニアリング

もしくはAutoencoderとかで自動圧縮?

「表現学習」

-.icon

回帰モデルの場合は、X_i

特徴量が与える影響が、学習の結果低くなったとしても、その情報が本当に価値がないかは分からない

同じ情報が別の特徴量にもエンコードされてて、その特徴量が使われてないだけかも