macOS:UTF-8-MACをUTF-8に変換する
macOS 上でファイル名を扱う場合 濁点、半濁点を含むファイル名の扱いが Windows や Linux と異なる
これは UTF-8 (NFC) ではなくUTF-8-MAC (NFD) と呼ばれる形式によるもの
UTF-8
文字コード上「E38390」として表現され、一文字として取り扱われる
UTF-8-MAC
濁点、半濁点の記号部分を一文字として扱い、例えば「バ」は「ハ」+「゛」として二文字として表現される
処理上は一文字となるが実際は二文字であり、UTF-8と比較したとき一致しない現象の原因になる
変換方法
iconv を使ってざっと変換してしまうのが一番簡単だと思われる
code:sh
ls -1 *.md | iconv -f utf-8-mac -t utf-8