UTF-16
Unicodeの文字を表現する文字符号化方式のひとつ。
16bit単位の情報の組み合わせで文字を表記する。
当初、Unicodeの文字符号化方式は1つしかなく、固有の名前はなかった (UCSにおいては、UCS-2と呼ばれるものに相当した)
これに対して、16bitの最小単位2個で1文字を表現するサロゲートペアが規定されたことにより、この機構を含む文字符号化方式に、UTF-16という固有の名前が与えられた。
UTF-16は、16bitを最小単位とするため、8bitを前提としたシステムでは、エンディアンの問題が発生する。
ビッグエンディアンを使用するか、リトルエンディアンを使用するかは、意識して利用しなければならない。
ISO/IEC 10646
UTF-16BE
UTF-16LE
RFC 2781 - UTF-16, an encoding of ISO 10646
バイト順マーク (BOM : Byte Order Mark)
UCS-2
C++ wchar_t型
UTF-8
UTF-32
UTF-16 - Wikipedia
UTF-16 - Wikipedia