混同行列
2つの軸があり、その掛け合わせの結果が関心事項
軸:
Predited: 予想をどうしたか
Actual: 実際にどうだったか
表の値部分に入るのは、この掛け合わせでカウントされた数
ここまでは良い。
引っかかるのは呼び名
TP(TruePositive), TN(略), FP, FN
軸の掛け合わせで呼ばれない、正解|不正解の True|Falseに、予想の Positive|Negative
結果、分割表では、Trueが対角線上に来る
例: Positive予想がTrueだったら、TP.
it is(was) True I guessed Positive.
この文でよいかな?
よい対応日本語が見つからない。
真(True), 偽(Positive), 陽(Positive), 陰(Negative)を当ててるが、、
くっつけると馴染みがなく、、日常語でない
あと、率、量ではなく、偽陽性と、"性"をつけるのは、、
感覚としてはわかるが、、、
真陽率、真陰率、偽陽率、偽陰率、みたいに作ってくれた方がよい。
--------------------------------以下は、昔のメモ
評価としては、正解、不正解の量を指標にして議論する(事が多い)
上記の4つの組み合わせで、それの割り算
通常、4つのうちから2つ( 6通り)を分母に、1つ(4通り)を分子にする割り算を評価指標とする。
そのままだと、24通りになるけど、よく使うものを、簡単に想起できるようにしておきたい。
全体で1になる、指標は裏返し(その両者を足すと1になる)などで、実質はかなり減る。
precise(Positiveなものに限定して、どれだけ拾えたか), accurate(, f1score, あと、事前知識として、TrueとFalseの割合を前置きで仮定してることはあるかも。
分類問題などはそうでないけど、日常生活での推測はTrue/False割合を考えることは多いと思う。
この前提条件を使うには?
人間は、組み合わせとか、二次元軸の認知は弱い。指標(1次元)で考えるのが通常、なので難しい。
confution matrix, error matrixという呼び名は、ActualとPredictedが一致しない(mislabeling)量に関心があるから
----------------以下は、自分でも何書いたか不明.... true, falseを勘違いしてる。
Confusion matrix, 混同行列のこと。
True - False: 実際に(仮説が)正しい(True)かそうでない(False)か? (実際(真実)は、神様しかわからん....正解有り学習とかはある)
Positive - Negative: 有意差がある(positive)とした、か、ないとしたか(negative)。 機械学習なら予測したとか、何らかの状況に基づいて、判定した。 positive,negativeが判定のどっち?かは、場合による。たぶん。
で、
True - Positiveと言う語順にするより、 PositveでTrueみたいに postive,negativeを先に言ったほうが素直な気がする
判定はnegativeですが、実際はTrueでした。。みたいなスポーツの判定だと、こういう語順が多い気が、、、
Positive, Negativeが正しいか、どうかで、True, Falseになるわけだから。 Predicated, Actual を使ってる。
predicateは、訳語はいろいろありえるけど、ジャッジする役割なので、どっちかにジャッジしました。くらいな感じかな。
https://gyazo.com/206fa6e878d4d60a9ae96688302f7867
Positiveだとしたけど、Falseだったものの割合。 詳細は上記リンク
日本語は、以下を引用。
https://gyazo.com/17a12ea7c20b094aebee6fa3f928b110
ROC曲線 、理解できてない じっくり時間をかけて読みたい。