書記素
grapheme
書記素とは、書記言語において意味上の区別を可能にする最小の図形単位をいう。(Wikipedia)
Unicode は複数のコードポイントで1つの書記素を表すことがある。
結合文字列(Combining Character Sequence)
基底文字の後に1~複数個の結合文字を続けたもの
基底文字(Base Character)
結合文字列の元となる文字
結合文字(Combining Character)
基底文字の後につなげて基底文字に記号などを付け加える文字
合成文字(Composite Character)
1文字ですべての記号を付けたもの
合字
アクセント記号
á (U+0061 U+0301)
合成用文字
印刷用合字
人間が解釈する文字としては2文字だが、フォントが1字として構成される。
有名なのは ff(U+FB00)で、ff(U+0066 U+0066)の合字
異体字
異体字セレクタ
絵文字
他の文字コードでも合字の概念があるが Unicode ほど厳格ではなく、実際うまく運用されていない。
JIS X 0208:1990 までは、2-94(◯)が「合成用丸」だった。(Uncodeでは U+20DD COMBINING ENCLOSING CIRCLE)
実際には活用される事なく、JIS X 0208:1997以降は「大きな丸」に変更された。(Uncodeでは U+25EF LARGE CIRCLE)
COMBINING ENCLOSING CIRCLEの例(表示は2文字なのにカーソル移動では1文字として取り扱われていることがある。)
2⃝
関連