Unicode
国際文字コード
ISO/IEC 10646
世界中の文字を扱えるようにしようとした
文字合成が出来る
ZWJ
Zero-Width Joiner
文字符号化スキーム
UTF-7
UTF-8
CESU-8
UTF-16
UTF-32
UTF-EBCDIC
SCSU
Punycode (IDN/IDNA)
GB 18030
この辺、全部ひっくるめてUnicodeなのかmrsekut.icon
#??
UnicodeとASCIIは互換性があるのか
つまり、ASCIIで表現された文字をそのままUnicodeで解釈しても、正しい文字が表示されるのか
Unicodeのcode point
0以上0x10FFFF以下の整数のこと
$ 2^{20}+2^{16}通りある
21ビットの整数で表現できる
https://qiita.com/mod_poppo/items/740659702f31216fdade#文字列とは
code unit
Unicode文字列をUTF-8やUTF-16等の符号化方式で表す時に使う、8ビット整数や16ビット整数のこと
https://qiita.com/mod_poppo/items/740659702f31216fdade#文字列とは
Unicodeスカラー値
/villagepump/ユニコードの闇
byte order mark (BOM)
UTF-8N
UTF-8-MAC
Unicode標準入門
ここでみた
https://gigazine.net/news/20231005-unicode/
最低限
https://mizunashi-mana.github.io/blog/posts/2020/11/unicode-surrogate-codepoint/
https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b