PDFをCosenseに変換する
PDFから、画像とOCRを生成し、それをJSONに変換し、Scrapboxにimportする 準備
mrsekut.iconは課金済みなので無課金で上手くいくか知らん
devboxを使っている
準備
「New Application」から作る
項目は何でも良い。あとから修正もできる
例
Nameは「pdf2scrapbox」
Callback URLは「http://example.com」
生成された項目のページに行ってから、一番下の「Generate」でtokenを生成
https://gyazo.com/347fde62dfa5d3c4a50a60809b7a4f86
Your access tokenのみをつかう
それ以外のidとかは使わない
.envを作る
code:.env
GYAZO_TOKEN="hoighaoha..."
手順
$ devbox shell
workspace/内に.pdfを入れる
複数可
画像の入ったディレクトリも可
$ bun run src/cli.ts
.pdf形式のファイルを順番に以下の処理が行われる
PDFを1ページずつ画像に変える
画像をGyazoに送り、OCRも取得
Cosense用のJSONを作成
ファイル名からISBNを探す
Cosense Projectを新規作成
JSONをimport
Scrapbox用のjson (out/hoge-ocr.json)を生成
DoSしないように100ページごととかで間隔あけてる