PDF2Cosense
todos
readme
理想的にはcosense projectが作成済みだとしても続行してほしい
とにかく冪等であってほしい
例えば、
まず普通にURLにアクセスしてみて存在するか確認
あればページ数を確認
overwriteしつつアップロードする
なければ作る
みたいな
progressbar?
失敗したocrを後から一気に再フェッチできるようにするとか?
スクボ読書済みのpdfをs3に投げる
1章が1ページのほうが良さそう
物理的な本の制約を食らってるだけな気がしてきた
改行しながら読む
視覚的に構造化する
Scrapbox読書のスクリプトにそういうのを入れる?
章の始まりのページをリストとして与えるとか、
それこそAIに解釈させるとか
OCRのテキストを信用できるかが味噌になってくるのか
そういう意味ではepubの方が良い
確かに、ocrしてる意味がそもそも薄いよな
最初からテキストで取れればいい
Gyazo OCRが変な箇所で改行されているので、joinしてからjsonに変換しておきたい
単語中で開業されるとリンクにできないので困る
検索にも引っかかりづらくなる
ただし、これは数学書など記号や図が多いとぐちゃぐちゃになってしまうかもしれない(?)
types/の中が適当すぎる
翻訳できないかな
deepl使うよりgpt-3.5使うほうがいいらしい
目次の扱い
スクボで良い感じに目次を生成してリンクにできないか
英語の論文とか、1ページの中で2blockにわかれてるやつも多くあるが、あれもうまくOCRできるのか?
↓こういう形式のやつ
https://gyazo.com/0c1cc73324228236edcb92f576ab00aa
kindle
kobo
英文の自動翻訳も載せる、とかするのも便利そう
PDF画像、OCR、翻訳