ブラウザ完結でJavaScriptでOCRして文字起こしするライブラリ
#Tesseract.js #OCR #文字起こし #WebブラウザのJavaScript #ライブラリ
https://gh-card.dev/repos/naptha/tesseract.js.svg https://github.com/naptha/tesseract.js
発見元: 寿司打の限界を目指して ~WebGLのOCR~ | WEB EGG
以下のREADMEによるとEmscriptenを使っているようなのでブラウザ完結で外部サーバーなしでOCRして文字起こしできるみたい。
Tesseract.js wraps an emscripten port of the Tesseract OCR Engine. It works in the browser using webpack or plain script tags with a CDN and on the server with Node.js. After you install it, using it is as simple as
軽く開発者ツールのネットワークタブみても外部に画像データを転送している様子はなかった。