UTF-8
#文字コード
Unicode
の文字符号化形式
1バイト(8ビット)単位で1~4バイトの可変長
日本語の文字は基本的に3バイト
「あ」はe38182
ASCII
範囲はASCIIと同一
ASCIIと互換性がある
1バイトで表現できてサイズが小さい
最近の規格では文字列のフォーマットをこれに固定しているものもある
Rust
や
Julia
,
TOML