同じ文字なのに複数のコードがあるもの
なぜ同じ文字なのに複数のコードがあるのか?
歴史的事情で、1つの文字コード体系で1つの文字に複数のコードが割り当てられてしまった。
Shift_JIS(正確にはWindows-31J) では、IBM拡張文字、NEC選定IBM拡張文字、NEC特殊文字がある。
Unicode 以外の文字コードを Unicode に変換した後、再び元の文字コードに戻したときに元通りになることを保証する必要がある。(例外あり)
グリフが同じで同じ文字のように見えるが、異なる意味のものはここには含まれない。 高(U+9AD8)
⾼(U+2FBC) 康熙部首
参考