文字コードの歴史
文字コード表
1バイト文字集合
ASCII
(
ISO/IEC 646
)
7ビット文字コード
ASCIIをベースに
ISO/IEC 646
として国際化
各国で標準化できるように
ASCIIは
ISO/IEC 646 国際基準版
という位置づけ
日本では
JIS X 0201
として策定
JIS X 0201
ISO/IEC 646
に準拠した日本での規格
7ビット及び8ビットの情報交換用符号化文字集合
ASCIIとの違い
0x5C
は円記号(
¥
)
0x7E
はオーバーライン(
‾
)
ISO/IEC 8859
群
8ビット文字コード
ISO/IEC 646
を発展させ、ヨーロッパ圏で複数言語を切り替える用途で標準化
ASCIIを8ビットに拡張
全16パートある
ISO/IEC 8859-1
=
Latin-1
ISO/IEC 10646
(Unicode)標準化取り組みのため、もう8859シリーズは新しいパートの開発をしていない
複数バイト文字集合
(
2バイト文字集合
)
ISO/IEC 2022
JIS X 0208
ISO/IEC 2022
準拠の
2バイト文字集合
7ビット及び8ビットの2バイト情報交換用符号化文字集合
0x21
から
0x7E
の94 * 94の組み合わせ(
8836文字
)
JIS X 0212
JIS X 0208
の補助漢字
JIS X 0213
第3水準
、
第4水準
の漢字
マイクロソフト標準キャラクタセット
世界中の文字を一つの表へ(
UCS
)
Unicodeのはじまり
ISO/IEC 10646
と
Unicode
が統合
JIS X 0221
ISO/IEC 10646
と技術内容が一致するように作成されている日本での規格
文字エンコーディング
/gosyujin-books/0397: 体系的に学ぶ 安全なWebアプリケーションの作り方.pdf#6238070f2c53d8000064f7c8
参考
/gosyujin-books/0393: 体系的に学ぶ 安全なWebアプリケーションの作り方.pdf#6238070f2c53d8000064f705
/gosyujin-books/0041: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74342c53d80000657bd2
さらに詳しく
文字コードの歴史を学べる本
(プログラマのための) いまさら聞けない標準規格の話 第1回 文字コード概要編 | オブジェクトの広場
Unicode文字一覧表 - instant tools