encoding
文字コード
のエンコーディング
機械学習における離散値の数値(連続値)化
Which encoding is good for time-validation?-1.4417 | Kaggle
label encoding
frequent encoding
pandas factorize
mean encoding
nejumi/kaggle_memo
カテゴリカル変数を、目的変数のそのカテゴリにおける平均値(期待値)に変換する。これはLikelihood EncodingあるいはBayesian Encoding(Multinomial Naive Bayesにかけるのと同じなので)と呼ばれる手法である。
Kaggle Meetup #4 Lightning Talks - Speaker Deck
こちらの解説がわかりやすそう。