はてなダイアリーの記事をMarkdownに変換していく
一回で綺麗に変換できなかったので、少しずつ変換した
使ったもの
記事が全てひとかたまりになっているもの
code:export.xml
<?xml version="1.0" encoding="UTF-8"?>
<diary>
<day date="YYYY-MM-DD" title="">
<body>
本文
本文
*記事のID*タグタグタイトル(同じ日に複数記事がある場合) 本文
</body>
</day>
<day date="YYYY-MM-DD" title="">
<body>
本文
</body>
</day>
<!-- 以下繰り返し -->
<day date="YYYY-MM-DD" title="">
<body>
<!-- 記事 -->
</body>
</day>
</diary>
大まかに実施した手順
記事xmlを分割して出力する
1記事に対して1Frontmatter、1本文を出力する
分割するのは、Pandocの変換がひとかたまりのxmlを想定していなかっため 1本文=1ファイルずつ食わす仕様になってるっぽい
FrontmatterとMarkdown変換した本文を合体する
手順
記事xmlを分割して出力する
記事xmlをパースしてそれぞれの記事のFrontmatterと本文を作る
Frontmatter出力ファイル例:header/YYYY-MM-DD-TITLE.md
本文出力ファイル例:body/YYYY-MM-DD-TITLE.md
ファイルタイトル
分割後のファイルタイトルはJekyllの生成ルールを踏襲(YYYY-MM-DD-TITLE.md)
YYYY-MM-DDは<day>タグのdate、TITLEは記事のIDを設定
注意
Pandocで変換するとTITLEに使用する予定の*記事のID*が消失してしまう
これが
code:sh
こうなってしまう
code:sh
------------------------
ので、先に退避させる
まだ書いてない
分割した本文をPandocでMarkddown変換する
FrontmatterとMarkdownの本文を合体する
TODO
はてなフォト記法がそのまま出力されている
リンク記法がそのまま出力されている