シンハラ文字日記
~ 2026/6/9
スリランカに行く確度が高まる
vive max でだいぶ怪しい
文字認識つけられないか?
1文字ずつでいい、画像分類の練習になる
ブラウザで動かしたいので onnxruntime-web で
クラス多いな & 怪しいな
データ数少ない
文字 / パーツ
文字の形式的定義の確認
音を転写するつもりで書くなら何個でも繋げられる?
前置も上限ないの??
フォント定義上
視覚的に成立するかもフォント都合かなあ
こんなの何文字でも行けるんじゃないのか??
Wikipedia で文字カウントする
実際にたくさんある
全 akshara(規則生成): 5471(全て renderable)
これは以下の組み合わせ
code:table
┌───────┬─────────────────────────────┐
│ Level │ 内容 │
├───────┼─────────────────────────────┤
│ L1 │ 独立母音(අ 等) │
├───────┼─────────────────────────────┤
│ L2 │ 子音単体(ක) │
├───────┼─────────────────────────────┤
│ L3 │ hal 止め(ක්) │
├───────┼─────────────────────────────┤
│ L4 │ 子音 + 母音記号(කි) │
├───────┼─────────────────────────────┤
│ L5 │ 子音 + anusvara/visarga(කං) │
├───────┼─────────────────────────────┤
│ L6 │ ZWJ結合・全子音ペア(ක්ක) │
├───────┼─────────────────────────────┤
│ L7 │ 横並び結合・全子音ペア(ක්ක) │
├───────┼─────────────────────────────┤
│ L8 │ ra/ya結合 + 母音記号 │
└───────┴─────────────────────────────┘
実際にはもっとあるらしい
子音が複数連なる
形式的定義