ひらがなとカタカナの埋め込み
https://gyazo.com/b4e5c4b7070cc735f798cdca0c1969a9
ひらがなとカタカナの対応関係(ひらがな・カタカナ、行、段、濁音、半濁音、小文字、の6次元)をt-SNEで2次元に埋め込んだらこうなった。 不思議な曲がり方をしているのは、単にt-SNEのせいであって、PCAで線形に次元削減すると自明な感じの結果が得られる。 https://gyazo.com/0167afbf8353c6785500f421f5a1eb59
翌日2018-12-01、行と段を回転エンコーディングしたことと、長音記号を足したことで10次元になった。