プログラマのための文字コード技術入門
http://image.gihyo.co.jp/assets/images/cover/2019/9784297102913.jpg
矢野啓介
文字コードの歴史を学べる本
書籍
2010年
プログラマのための文字コード技術入門:書籍案内|技術評論社
2018年
[改訂新版]プログラマのための文字コード技術入門:書籍案内|技術評論社
関連
文字コード表
文字コードの歴史
符号化文字集合
制御文字
図形文字
/gosyujin-books/0036: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74342c53d80000657b28
/gosyujin-books/0004: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74342c53d80000657368
符号
10101010
…第2ビット、第1ビット
8ビットを1バイト(1オクテット)
2^8 = 256ビット
符号位置
/gosyujin-books/0034: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74342c53d80000657adc
外部コードと内部コード
/gosyujin-books/0369: 文字コード技術入門.pdf
Unicodeの諸問題
NFD
、
NFC
U+3099
U+309A
Katakana
Hiragana
UCA: Katakana/Hiragana
JIS 2000
JIS 2004
JIS X 0213:2000
JIS X 7012
RFC 1468
RFC 1554
RFC 1922
RFC 2045
RFC 2047
RFC 2231
RFC 2237
RFC 2781
RFC 2978
RFC 3629
RFC 3986
Shift_JIS
で手当てが必要
0x7E
0x5C
鼻濁音
SPは制御文字か図形文字か?
文字集合
符号化文字集合
符号化方式
EUC-JP
と
ISO-2022-JP
は
ISO/IEC 2022
に整合的
第1水準漢字
おおむね読み順に並んでいる
第2水準漢字
おおむね部首、画数順に並んでいる
JIS X 0208
参考
/gosyujin-books/0078: 改訂新版 プログラマのための文字コード技術入門 00.pdf#628b74352c53d80000658302
(プログラマのための) いまさら聞けない標準規格の話 第1回 文字コード概要編 | オブジェクトの広場
JIS漢字コードの変遷
JIS83制定時の変更点 - CyberLibrarian
JIS X 0208の改正と混乱
あなたの名前はきちんと登録されているか
あの字はどこに?