ユニコードの闇
Unicode で全て解決、とは ならなかった
闇要素
BOM を付けないほうをUTF-8Nという
そんなこと聞いたことありませんbsahd.icon
BOM を付けたUTF-8 のスクリプトファイルでは、処理系によっては実行できないことがある
処理系がBOM をうまく扱えないため、エラーになる
UTF-8-MACでは、「パ」のように濁点・半濁点がついた文字が、「ハ」+「半濁点」という形で保存されている
「パ」1文字で保存するのをNFC(Normalization Form Canonical Composition)、 「ハ」+「半濁点」の2文字で保存するのをNFD(Normalization Form Canonical Decomposition)という
これウザいよねー 増井俊之.icon