REXMLの更新でEPUB Parserが死んだ
REXMLがREXML::ParseException: Malformed XMLを出している。 Gemfileを調整すると、REXML 3.3.3以降だとテストがこけてしまう。
code:xhtml
のlang="ja"を消すとテストが通る。
DOCTYPEをXHTMLの物にしたりもしたけど(今はHTML5の物)、だめだった。関係無いみたい。
これが本当にXML(XHTML)としてinvalidなのかどうかは改めて仕様とか別実装とか調べようと思う
(今はW3Cが仕様を定めているけど)今の電子書籍の広まる時期にEPUB 3の仕様を定めていたIDPFによるEPUBファイルのサンプル集はみんなこの書き方をしていて、現実問題としてこれはパースできてほしい。 XMLとしてここのパースが本当はエラーにならないという仕様なのであればREXMLにパッチを投げる
エラーにするのが正しいとしたら
ここを旧バージョンの振る舞いにできるオプションとか探す
最後はmethod refinementsとかでパッチしながら使う