Brotli
#LZ圧縮
#可逆圧縮
#圧縮
可逆圧縮
アルゴリズム
LZ77
・
ハフマン符号化
・
Context Modeling
Google
による
https://datatracker.ietf.org/doc/html/rfc7932
https://github.com/google/brotli
辞書
仕様に122,784バイトもの辞書データが含まれているのが特徴
RFC
の半分くらいがその辞書データの原本で構成されている
RFC内ではバイナリのhex表記だが、stringを取り出してみるとこんな感じ
https://gist.github.com/klauspost/2900d5ba6f9b65d69c8e#file-dictionary-txt
以下のような内容が含まれる:
time
・
down
・
life
などの頻出英単語
スペイン語
・
ロシア語
・
アラビア語
・
中国語
などの頻出パターン
100%
・
</a>
・
=window
など、
HTML
・
CSS
・
JavaScript
で頻出するパターン