書き起こす書籍のパターン
書き起こし
ノウハウ
ここでは、一般公開しても問題のない(
著作権切れ
の)書籍を前提にします
1. とうの昔に
著作権
が切れて、
国立国会図書館
などで一般公開されている書籍。
『ドン・キホーテ』島村・片山訳の書き起こし
で使用している本はこのタイプ。見開き一頁ずつ画像データ化できるので、
OCRを使って書き起こす
ことができる。ただ昔の本のため
旧字旧仮名
のことも多い。
青空文庫
は
旧字、旧仮名で書かれた作品を、現代表記にあらためる際の作業指針
などの方針を用意している。
2. 著作権は切れているが、国立国会図書館などで
スキャンデータ
が一般公開されていない書籍。理由はさまざま。現物を手に入れて適当な方法で作業するか、
個人向けデジタル化資料送信サービス
にあれば、それをを参照しつつ手打ちになる。
3. 著作権は切れているが、スキャンデータは一般公開されておらず、書籍も
絶版
となり手に入れるのが難しい書籍。
古書
として手に入れるか、
図書館
に赴いて探す。