符号化文字集合
#テキストの符号化
#情報理論とデジタル表現(OUJ)
符号化文字集合
ASCII
JIS X 0208
Unicode
文字符号化方式(エンコーディング)
Shift_JIS
ISO-2022-JP(JISコード)
EUC-JP
UTF-8
符号化文字集合と文字符号化方式は1:1ではない
EUC-JPはASCIIとJIX X 0208を組み合わせて表現できる
#文字コード
CCS: Coded Character Set
文字コードで表現可能な文字の範囲のこと
日本語文字集合で言うと
JIS X 0201 + 0208 + 0212
JIS Xと略記する
UCS (ISO-10646)
JIS Xは
ISO-2022-JP(JISコード)
Shift_JIS
EUC-JP
が用いる符号化文字集合
ASCII
の文字と日本語文字と少数の記号が含まれる
UCSは
Unicode
の文字集合で、日本を含む各国の文字が含まれる