f0bda0ad7f5c,010
http://nhiro.org.s3.amazonaws.com/4/6/4608ca3cdd5a139cf8cb707a265b33c9.jpg https://gyazo.com/4608ca3cdd5a139cf8cb707a265b33c9
(OCR text)
PDFMinerの出力
ページ区切り記号
ページ番号、章タイトル、見出し
·これらを取り除く「本文抽出」が必要
にしみたといったところで、計算ドリルや漢字練習といった宿題 に、 さっさと取り組
身
こんな私でもなんとかやってます
第二章
2/
^Lむことができないのは相変わらず です。七歳 のときにはす でに、私の中に、真面目な自分
と不真面目な自分ができていました。真面目 な自分 はちゃんと宿題をやっていって、「で