基準率錯誤
類義語:基準率の誤謬
ある種のがんがあり、全人口の1%がこのがんに罹患する。医師がある検査をすれば見つけることができ、信頼性は80%だと言う。実際にがんにかかっている人の100%がこの検査で陽性になるが、偽陽性の確率も20%あると言う-実際にがんにはかかっていない人でも20%の人に陽性という結果がでる。このような検査を受けて陽性となったとき、人は80%の確率で自分はがんに罹患していると考えてしまう。実際には罹患している可能性は5%以下であることをDevlinは説明する。統計数字を聞かされるうちに人の頭から抜け落ちてしまうものは基準率の情報である。 医師に対してこのように質問すべきである、“陽性という結果がでた人の中で実際にがんにかかっている人は何人でしょうか?(これが検査を受ける側としては気になる基準率になる)
タクシー問題
ある夜にタクシーがひき逃げ事故を起こした。その町には、緑タクシーと青タクシーの二つの会社がある。台数比で言うと緑は八五パーセントで、青は一五パーセントである。この事故には目撃者がおり、彼は青タクシーが事故を起こしたと証言している。ただし夜であり、緑と青は区別が難しいので、同様の状況で目撃者がどの程度確実に証言ができるかをテストした。その結果、正しく証言できる確率は八〇パーセントであった。さて、事故を起こしたのが本当に青タクシーである確率はどのくらいか。
この問題を出すと怪訝な顔をする人もいる。正しく証言できる確率は八〇パーセントなのだから八〇パーセントだろう、と考えるからだと思う。別の人たちは答えが八〇パーセントではそもそも問題と呼べないので、もう少し低めで七〇パーセントくらいかななどと考えたりする。また、青タクシーの台数の割合は一五パーセントなのだから、(証言の有無にかかわらず?)一五パーセントと答える人も若干名存在する( 60)。
しかし、いずれも正しくない。答えは四〇パーセント程度となる。これは驚きではないだろうか。私もこの問題とその答えを見た時に信じられないと思った。青タクシーの確率が四〇パーセントであるということは、緑タクシーが事故を起こした確率は六〇パーセントとなり、証言の意味がなくなってしまうと考えたからである。
乳がん問題
四〇代の女性の乳がんの比率は一パーセントである。乳がんを持つ人にある検査を行うと、八〇パーセントの確率で乳がんであるという結果が出る。一方、乳がんではない人に同じ検査を行うと、九・六パーセントの確率で乳がんであるという結果が出る。ある四〇代の女性がこの検査の結果、乳がんであるとされたが、この人が実際に乳がんである確率はどれほどか。
この場合も、ベイズの定理に基づく答えは七・八パーセントとなり、大変に反直感的である。しかし、人口の大多数を占める乳がんでない人(九九パーセント)が乳がんと診断される確率が九・六パーセントもあることを考えると、ここがきわめて大きな値になり、結果として本当に乳がんである確率は、やはり八パーセント弱となるのである。実際、この値と近い答えを出す人はほとんどいない。多くの答えは、診断率である八〇パーセントに微調整を加えたものとなっている。ここでもまた、事前確率は無視され、尤度からの微調整で判断が行われているのである。
部族の奇病問題*1
ある部落に出かけた医者が、奇妙な病気を発見した。何回も診察しているうちに、彼はこの病気の検査法を考えついた。今まで一〇〇〇人を診察し、そのうちの一〇人がこの病気にかかっていたが、この一〇人に検査を行うと八人が陽性と出る。念のため、この病気ではなかった残りの九九〇人に検査を行うと九五人に陽性という結果が出た。さて、ある日この部落のある人にこの検査を行ったところ、陽性という結果が出た。この人がこの奇妙な病気にかかっている確率はどれほどか。
数学的には乳がん問題と同じだが、部族の奇病問題では病気にかかっている割合を低く推定できる。
論文
(60), Tversky, A., & Kahneman, D. (1980). Causal schemas injudgments under uncertainty. In M. Fishbein (Ed.), Progress in Social Psychology.
*1, Gigerenzer, G., & Hoffrage, U. (1995). How to improve Bayesian reasoning without instruction: Frequency formats.
出典