Brotli
#LZ圧縮 #可逆圧縮 #圧縮
可逆圧縮アルゴリズム
LZ77・ハフマン符号化・Context Modeling
Googleによる
https://datatracker.ietf.org/doc/html/rfc7932
https://github.com/google/brotli
辞書
仕様に122,784バイトもの辞書データが含まれているのが特徴
RFCの半分くらいがその辞書データの原本で構成されている
RFC内ではバイナリのhex表記だが、stringを取り出してみるとこんな感じ
https://gist.github.com/klauspost/2900d5ba6f9b65d69c8e#file-dictionary-txt
以下のような内容が含まれる:
time ・ down ・ life などの頻出英単語
スペイン語・ロシア語・アラビア語・中国語などの頻出パターン
100% ・ </a> ・ =window など、HTML・CSS・JavaScriptで頻出するパターン