Unicodeのはじまり
4バイトで1文字
2バイトのサブセット
互換性は乏しい
2バイトで1文字
4バイトという建前は残しつつ、16ビット固定というUnicodeの設計を反映して下位2バイトの領域の中にすべての文字を配置した、実質的に2バイトの符号化文字集合として作成されたのです。 10646には4バイトコードとそのサブセットである2バイトコードとがありますが、後者がUnicodeそのもので、前者は後者に0000という上位2バイトをただ付けただけのものとなってしまいました。 Unicodeの設計に寄せた
しかし、2バイト = 16ビット = 65536文字では世界中の文字を収めるのは無理
16ビットを2つ並べて1文字を表せるか?
参考