レシートの画像を読み取って家計簿をつける
ために調べたことをメモ。
画像を読み込みってことでまず思いついたのが前に読んだこの記事。
Image To Text Conversion With React And Tesseract.js (OCR)
で、これを試してみたんだけどちょっと日本語の読み取り精度が微妙。
Tesseract.js で言語だけを指定して画像認識をしてみる
これを試してみる時に、Google純正のカメラアプリを使ってて、
Google Lens
のほうが精度が高そうと思い、
GCP
の
Vision API
を次に検討。
これが結構精度がよく、実際に自分で
Vision API
を
Node.js
で叩いてみてなかなかよさげな感触。
同じようなことやってる人いないかググってみたら以下がヒット。
【Google Colab】Vision APIで『レシートOCR』
これは
Python
だけど結構よさげな感じで読み取れてた。
あとはおそらく大量のレシートを読み込んで精度をあげていく調整をしていく感じなのかな。