UTF-8
8ビット単位のUnicode符号化方式
0x00から0x7FはASCIIと互換性がある
複数バイトの場合も、2バイト以降に0x00から0x7Fが来ない
0x00(0000 0000)
...
0x7F(0111 1111)
0x80(1000 0000)
2バイト以降は必ずここから始まる
UTF-8の求め方#62be5c5cf4582000008f2fd8
---
ISO/IEC 10646
RFC 3629