UTF-8
RFC 3629
ISO 10646 と Unicode で使える符号化方式
The Open GroupのFile System Safe UCS Transformation Format (FSS-UTF) が元
FSS-UTF, FSS/UTF, UTF-2 などを経てUTF-8に落ち着く
UCS Transformation Format 8
Unicode Transformation Format-8
ISO 10646 で取り込まれ、Unicode側も更新された形?
ISO 10646も考慮されて32bitに対応していたがUnicode側から取り込まれた形?
Unicode では v1.1でFSS-UTFが追加されているがサロゲートペアで21bit化されるのはv2.0
RFC 2044 から RFC 2279, RFC 3629
UTF-16, UTF-32でバイト順を判定するために使われているBOMは逆順がないため不要
当初はISO 10646の32bit空間に対応していたが、21bit 10ffffまでの空間に制限されている
他 UTF-16, UTF-32, UCS-2, UCS-4, Punycode
廃止 UTF-1, UTF-7
RFC 3629 UTF-8
順?
1993 The Open Group X/Open Document Number:P316 FSS-UTF https://www.unicode.org/L2/Historical/wg20-n193-fss-utf.pdf
1993-05-01 ISO/IEC 10646-1:1993
1993 Unicode v1.1 Appendix F FSS-UTF 標準ではない https://www.unicode.org/versions/Unicode1.1.0/appF.pdf
1994 RFC 1641 Using Unicode with MIME
1994 RFC 1642 UTF-7 (UTF-8 の別名としてUTF-FSSも記述あり)
1996-07 Unicode 2.0 サロゲートペア(UTF-16?)
1996-10-15 ISO/IEC 10646-1:1993 Amd 1:1996 https://www.iso.org/standard/26222.html UTF-16
1996-10-15 ISO/IEC 10646-1:1993 Amd 2:1996 https://www.iso.org/standard/26223.html UTF-8
1996 RFC 2044 UTF-8
1999 Unicode 3.0
2000 RFC 2781 UTF-16 Unicode 3.0 ISO 10646-1 Annex Q
2000 JIS X 0213:2000 多言語面利用
2001 Unicode 3.1 多言語面利用開始
2003 RFC 3629 UTF-8 を正規の範囲のみに制限 Unicode を元とする
2004 JIS X 0213:2004
2004-09 JDK 5.0
2006 Windows Vista