Kindle書籍をPDFに変換する
DRMのかかっていないKindle書籍ならCalibreという変換ソフトがつかえるらしい
from https://applica.info/kindle-printing
DRM解除もできないことはないらしいが、や(ってばれ)るとアカウントを永久BANされるのでしないほうがいい
私的利用の範囲に留めるなら、screen shotを撮影するのが一番無難
方法1: Kindle for PCでscreen shotを撮影する
手順
1. screen shotを撮影する
流石に手作業で撮影するのは大変なので、RPAを使う
ここではUiPath Studioここで紹介されているツールを使うとよい
pngファイルをきれいに取得できる
2. screen shotをOCRする
Kindleのテキストを選択してコピーするのは無理があった
選択範囲が普通の形式じゃない
マウスのドラッグ&ドロップと<C-c>で行けそうな気もするが、やや難しい
tesseractでOCRするほうが楽だと思う
ちなみに、UiPath Studioにもtesseractが付属しているが、精度が悪いので使わないほうがいい
TerminalでPDFをOCRしてテキストファイルを作成しておく
3. 画像をPDFに変換する
cons
originalの解像度でデータを取得しにくい
originalのテキスト情報を取得できない
方法2: Kindle Cloud Readerをweb scrapingする
Kindle Cloud ReaderのDOMの中に、originalのページ画像がdata URIの形で埋め込まれている。それをページをめくりながら一つづつ取得すればいい
scriptは伏せておく
公開すると私的利用の範囲を越えそうなので……takker.icon
/takker-memex/Kindle Cloud Readerからページの画像を取得する
pros
originalの解像度で取得できる
仮想desktopを併用すれば、backgroundで動かせる
cons
Kindle Cloud Readerで開けない書籍もある
方法3 pyautoguiを使う
多分pdf化まで自動でできるはず
まだ試してないtakker.icon
References
【Python】pyautoguiを使ってKindle書籍を自動でスクショするツールを作ってみた! | 都会のエレキベア
Kindleの自動スクショ保存プログラム - Qiita
#2021-03-01 15:59:07
#2021-02-17 14:29:53