バッチ的目次生成技術
バッチ的目次生成技術
バッチ的なので,自動化を含めた効率的なやり方を考える
一番使えるのは,スタイルを適用した目次ページ
Clalibreのプレーンテキストの目次を人間が
多少自動化したくなるので,ちゃんとしたテキストプロセッサでやるのが吉かも
LLMに渡して目次を作る
OCRして人間が階層構造を作る
/motoso/アクティブ読書用の目次を作成する
LLMを利用した試み
芳しくない様子?
スタイルを適用しないと階層構造が表現されないものが多々ある
Epubの中身は低品質HTMLだから
obsidiandでEpubを読むを試行してみて,正規表現で,ある階層の見出しを抽出できるかもしれないと思った
あいにくObsidianは正規表現を使った置換が苦手なのだが
vscodeでいいか
リアルタイムプレビューがなく,インデントされない
以外と厳しいかも
特異性が低い
目次オンリーだったら行けるかも
目次のデータベースがありたい
せっかく作ったら,シェアしたいし,シェアされたい
目次に著作権はあるかの確認は必要
位置特定はそれぞれの媒体に合わせるので,シンプルな階層構造だけ記述した目次
目次情報をマークダウンの文中に位置を照合することが必要
手動でもやりたいので一旦マークダウン形式で出力するのがいいのでは?
最終的にはjsonあたりで階層を表現して、照合に備える
目次と本文のマージ
markdown to scrapboxもいったんマークダウンをjsonに変換してみるか