7762aa93ff14030
http://nhiro.org.s3.amazonaws.com/4/5/45ac75d3895504760adf559bc34de0e1.jpg https://gyazo.com/45ac75d3895504760adf559bc34de0e1
(OCR text)
31
LabelBinarizer
特徴量に名義度のものが混ざっているという噂
分布を眺めてみたけどそれらしき分布は見つから
ない.(でも名義尺度の頻度順ソートかも)
全特徴量をLabelBinarizer#fitしてLRしたら改善
-0.67+0.00
0.66674
LR
LABELLR -0.61±0.00
0.59759
確かに名義尺度が
混ざっているのかも.。
for i in range(NUM_FEATURES):
lb =
preprocessing.LabelBinarizer()
labelsi lb.transform(xs;,i) .. O
XS =