紫苑の書のテキスト抽出
Promise
を理解して久々に
PDF.js
動かしてみたらあつさり抽出に成功したので
コピペで発生する謎の文字化け
の問題で長らく悩まされてた
https://niftg.github.io/xionpdfstr/x.test.html
さしあたりHTML化したもの📜
ここから何も進んでない
図表とかの特殊ページ何とかしたい
🙂
紫苑の書 2011年10月24日 初版第1刷発行
🙂
#👹
ゆくゆくはこれ単体で読解できるやうな教材めいたものにしたかつた
簡易辞書附属のテキスト