encoding
文字コードのエンコーディング
機械学習における離散値の数値(連続値)化
Which encoding is good for time-validation?-1.4417 | Kaggle
label encoding
frequent encoding pandas factorize
mean encoding
nejumi/kaggle_memo
カテゴリカル変数を、目的変数のそのカテゴリにおける平均値(期待値)に変換する。これはLikelihood EncodingあるいはBayesian Encoding(Multinomial Naive Bayesにかけるのと同じなので)と呼ばれる手法である。
Kaggle Meetup #4 Lightning Talks - Speaker Deck
こちらの解説がわかりやすそう。