PDFをScrapboxに変換する
PDFから、画像とOCRを生成し、それをJSONに変換し、Scrapboxにimportする 準備
mrsekut.iconは課金済みなので無課金で上手くいくか知らん
node.jsが入っている必要がある
少なくともv11.15.0は動かない
少なくともv16.5.0では動いた
準備
「New Application」から作る
項目は何でも良い。あとから修正もできる
例
Nameは「pdf2scrapbox」
Callback URLは「http://example.com」
生成された項目のページに行ってから、一番下の「Generate」でtokenを生成
https://gyazo.com/347fde62dfa5d3c4a50a60809b7a4f86
Your access tokenのみをつかう
それ以外のidとかは使わない
手順
$ npm i
.envを作る
code:.env
GYAZO_TOKEN="hoighaoha..."
workspace/内に.pdfを入れる
複数可
画像の入ったディレクトリも可
$ npm run main
.pdf形式のファイルを順番に以下の処理が行われる
PDFを1ページずつ画像に変える
Gyazoに送る
Scrapbox用のjsonを生成
OCRの取得
Scrapbox用のjson (out/hoge-ocr.json)を生成
DoSしないように100ページごととかで間隔あけてる
Scrapbox projectを作るなどする
project名は24文字以内じゃないといけない
mrsekut-book-<ISBN>
選択肢は、上から
private
personal
gyazo
を選択してるmrsekut.icon
Scrapboxにhoge-ocr.jsonをimportする
project settings > page dataからimportする
hoge-ocr.jsonを
parseに失敗してerrorになった場合
https://gyazo.com/0919e218f60d057cfd1a37a2c94ff6c6
VSCode上でjson開いてcmd-sして自動formartすると直る
あとはお好みで
タイトル画像をpin留めする
Titleでsortさせて表示する
栞の代わりにpin留めする
参考