UTF-8
8ビット単位の
Unicode符号化方式
0x00
から
0x7F
は
ASCII
と互換性がある
複数バイトの場合も、2バイト以降に
0x00
から
0x7F
が来ない
0x00
(
0000 0000
)
...
0x7F
(
0111 1111
)
0x80
(
1000 0000
)
2バイト以降は必ずここから始まる
UTF-8の求め方#62be5c5cf4582000008f2fd8
---
ISO/IEC 10646
RFC 3629