UTF-8
#文字コード
Unicode の文字符号化形式
1バイト(8ビット)単位で1~4バイトの可変長
日本語の文字は基本的に3バイト
「あ」はe38182
ASCII 範囲はASCIIと同一
ASCIIと互換性がある
1バイトで表現できてサイズが小さい
最近の規格では文字列のフォーマットをこれに固定しているものもある
Rust や Julia, TOML