文字コードの歴史
文字コード表
1バイト文字集合
ASCII(ISO/IEC 646)
7ビット文字コード
ASCIIをベースにISO/IEC 646として国際化
各国で標準化できるように
ASCIIはISO/IEC 646 国際基準版という位置づけ
日本ではJIS X 0201として策定
JIS X 0201
ISO/IEC 646に準拠した日本での規格
7ビット及び8ビットの情報交換用符号化文字集合
ASCIIとの違い
0x5Cは円記号(¥)
0x7Eはオーバーライン(‾)
ISO/IEC 8859群
8ビット文字コード
ISO/IEC 646を発展させ、ヨーロッパ圏で複数言語を切り替える用途で標準化
ASCIIを8ビットに拡張
全16パートある
ISO/IEC 8859-1 = Latin-1
ISO/IEC 10646(Unicode)標準化取り組みのため、もう8859シリーズは新しいパートの開発をしていない
複数バイト文字集合(2バイト文字集合)
ISO/IEC 2022
JIS X 0208
ISO/IEC 2022準拠の2バイト文字集合
7ビット及び8ビットの2バイト情報交換用符号化文字集合
0x21から0x7Eの94 * 94の組み合わせ(8836文字)
JIS X 0212
JIS X 0208の補助漢字
JIS X 0213
第3水準、第4水準の漢字
マイクロソフト標準キャラクタセット
世界中の文字を一つの表へ(UCS)
Unicodeのはじまり
ISO/IEC 10646とUnicodeが統合
JIS X 0221
ISO/IEC 10646と技術内容が一致するように作成されている日本での規格
文字エンコーディング
/gosyujin-books/0397: 体系的に学ぶ 安全なWebアプリケーションの作り方.pdf#6238070f2c53d8000064f7c8
参考
/gosyujin-books/0393: 体系的に学ぶ 安全なWebアプリケーションの作り方.pdf#6238070f2c53d8000064f705
/gosyujin-books/0041: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74342c53d80000657bd2
さらに詳しく
文字コードの歴史を学べる本
(プログラマのための) いまさら聞けない標準規格の話 第1回 文字コード概要編 | オブジェクトの広場
Unicode文字一覧表 - instant tools