広辞苑のデータ量
32GB 無いと生データが載らない
字数は約 1500 万字
■広辞苑のデータ量について
広辞苑何冊分かを計算するためには、広辞苑について知る必要があります。そこで調べてみると、岩波書店の「広辞苑あれこれ」には次のような記載がありました。
1ページは24字詰め50行、4段組。本文3181ページで、約1500万字となります。岩波新書にすると約150冊分。また、『広辞苑』を毎日1ページずつ読もうとすると8年以上かかることになります。
岩波書店 広辞苑
上記をそのまま計算すると、1ページあたりの文字数は、
24×50×4=4800 文字となります。
1行の途中で文が終わるとその分文字数が減ります。なので、そのことを考慮して、1ページあたりの平均文字数は4700文字とします。
そうすると、1ページあたりの情報量は9,400バイトです。
次にページ数ですが、これは巻末付録も含めて3,216ページ。本文と付録で1ページあたりの文字数に違いはありますが、ここでは分かり易く、付録部分も本文と同じ文字数としておきます。
そうすると、4700×3216=15,115,200で約1511万5000文字です。
上記岩波書店の約1500万字とほぼ同じような値なので、これを採用します。
情報量に直すと15,115,200×2=30,230,400バイトです。
分かり易くすると、
30,230,400バイト÷1024÷1024=28.8ギガバイトとなります。