「日本人の6人に1人は偏差値40以下」は自明か?
イントロ
日本人の6人に1人は偏差値40以下という見出しから始まる記事が話題を呼んでいる。これは小泉進次郎構文的なトートロジーであって「東京ドームは東京ドーム1個分の大きさである」のような自明な主張に過ぎない……という意見がその多くを占めているのだが、果たして本当にそうだろうか? どんな試験を行っても、6人に1人は偏差値40以下になってしまうのだろうか? 実際にやってみよう
元記事の母集団は日本人となっているので、日本人を対象にしたテストが良いだろう。例えば、我々日本人の「生きる力」を測定するために、何歳まで生きたかを得点にするのはどうだろうか? 60歳まで生きたら60点、90歳まで生きたら90点である。よくある100点満点のテストに似せるため、100歳を超えたら100点満点でカンストすることにしよう。
もちろん、長生きすることが必ずしも人間として素晴らしいとは限らない。短命の偉人はいくらでもいるし、長命の犯罪者も珍しくはないだろう。だが、元来テストとはそういうものである。人物を適当な評価軸で切り取って評価しているに過ぎず、大学入試の得意な人が就職面接は苦手であるといった状況は起こり得る。いま設計したテストが単に他の要素を全無視して生きた年齢のみを評価しているというだけの話である。
この試験の良いところは厚生労働省が既に実施してくれていて、簡易生命表が使えるところである。その表によると、結果は次のグラフのようになっている。0点の人数が少し目立つのは0歳児が生まれたばかりでリスクが高いことを意味しており、100点にピークが立っているのは100歳以上を全員100点とみなした結果である。また男性より女性のほうが平均年齢が高く、右寄りの山になっている。 https://gyazo.com/4ba5d17e877d108865070183d676f3ee
結果
さてこの試験、何点取れば偏差値いくらになるのだろうか? 日本人の平均寿命が80歳を越えていることからも分かるように、この試験の平均点は約84点と非常に高い。偏差値50は平均点を意味するから、この試験で50以上の偏差値を取ろうと思うと85歳以上まで生きる必要がある。このような試験では100点をとっても約62と大した偏差値にならないが、57点で既に偏差値30を切ってしまうため低得点者には厳しい結果となる。
https://gyazo.com/c5383c0eac6734f23bec1320ddfc330d
ではこの試験で偏差値40以下となる割合はいくらだろうか? 次のグラフは偏差値を横軸にとって、縦軸にその偏差値以下の累積人数をとり百分率に直したものである。これによると偏差値40以下は約12.8%である。1/8=0.125だから、その割合は約8人に1人と言って良いだろう。……あれ? おかしくないか? 6人に1人は偏差値40以下なのではなかったか?
https://gyazo.com/21082e3a6fc7646686289493b7355445
なぜこうなるのか?
実は偏差値40以下の割合が確実に約6人に1人となるのは、母集団が正規分布に従う場合に限られる。そうでない分布の場合、6人に1人になることもあるし、ならないこともある。今回のテストは平均点が高いし、点数分布がピークを軸にして左右対称でもないため、正規分布の結果が適用できなかったのである。
わざわざ変なテストを設計したからそうなったのであり、普通は正規分布に従うはずだと思うかもしれないが、少し検索すれば大学入試センター試験のような慎重に設計された試験でも、非対称な分布が出現することはすぐ分かる。偏っているどころか、2020年度の世界史Bのように、二峰性の分布になることすらある。そのような場合には「6人に1人は偏差値40以下」という主張は全く自明ではない。元記事をよく読めばきちんと正規分布を仮定したと書いてあるのだが、どんな試験でもそうなると誤解している方がかなり多そうなので反例を作ってみた次第である。