OCRをローカルで行うことは可能
PythonとOCRエンジンで画像から文字を認識する - Qiita
【Tesseract】Pythonで簡単に日本語OCR - Qiita
いけそう
必要なパワーと環境がまだわからんが
sta.icon
数秒くらいでサクッと行うって無理かな?
Pythonでpdfを画像として認識しテキストを抽出を試してみる(pyocr) | DevelopersIO
pdfはpdf2image的なのを使う
結局は精度なのでチューニング必要そう?