ndlpdf
日本語、縦書き、段組などに対応
code:sh
# 基本の使い方
ndlpdf input.pdf
# txtファイルも出力
ndlpdf input.pdf --txt
# GPUを使う
ndlpdf input.pdf --device cuda
# OCRに利用する画像のレンダリング解像度
# メモリ消費・計算量は大きくなるが、高解像度の方がOCR精度が高くなる
# 出力出力ファイルサイズには影響しない
ndlpdf input.pdf --dpi 300
# デバッグモード:認識した文字と枠を表示する
ndlpdf input.pdf --debug