精度は高いが適合率も再現率も低い例
不均衡データで起きうる
希少疾患の診断
全体 10000 人のうち 1% の 100人が実際に疾患があるとして、
200人を疾患ありと予測して、うち10人が実際に疾患があり、
9800人を疾患なしとして予測して、90人の実際の疾患を見落とすと
table:matrix
Predicted
PP PN
Actual P 10 190
N 90 9710
Accuracy = (TP+TN) / (TP + TN + FP + FN) = (10 + 9710) / 10000 = 0.972 ← 高そうに見える
Precision = TP / (TP + FP) = 10 / (10 + 190) = 0.05
Recall = TP / (TP + FN) = 10 / (10 + 90) = 0.1