Unicodeの愛をUTF-8で求める
3バイトになるパターン
愛
は
U+611B
UTF-8では
0xE6849B
UTF-8の求め方
で実際に求めてみる
1. 符号位置
0x611B
の範囲を確認する
リンク先での表3の範囲になる
2.
0x611B
を2進数で表す
=
1100001 00011011
=
0110 000100 011011
... (
UTF-8
のバイト列用
1110xxxx 10xxxxxx 10xxxxxx
に分ける)
3. 表のバイト列の
x
に当てはめる
code:ㅤ
1110xxxx 10xxxxxx 10xxxxxx
0110 000100 011011
11100110 10000100 10011011
4. 3.で求めたバイト列を16進数に変換する
=
0xE6849B