2023-04-20
Скрипт працює, але має проблеми з видобуванням метаінформації кирилицею / The script works, but has issues with extracting Cyrillic metadata.
zx google-play-book-downloader.mjs
Я користуюся ним для отримання зображень, а вже PDF створюю з допомогою img2pdf, й розпізнаю текст з допомогою OCRmyPDF / I use it to obtain images, and then create PDFs using img2pdf, and recognize text using OCRmyPDF. pngquant -fv --ext=.png --skip-if-larger --speed=1 --quality=95-100 *.png vb.icon високоякісне стиснення зображень PNG з втратами (40-70%), завдяки оптимізації кольорової палітри
oxipng --dir . --strip safe --interlace 0 -o 4 *.png vb.icon додаткове стиснення без втрат (3-5%) для зображень PNG, створених pngquant
img2pdf img1.png img2.jpg -o out.pdf vb.icon створення PDF із отриманих зображень
Ще один альтернативний шлях ствоерення PDF і розпізнавання тексту — використання можливостей macOS з допомогою Automator / Another alternative way to create PDFs and recognize text is by utilizing macOS capabilities through Automator. https://scrapbox.io/files/64423344d07d88001ce7a3e0.png