CSV→Parquet変換
エンコード形式は
snappy
にすると350GBのCSVが28GB程度になった. 約1/10
20億件のデータのロードが1分程で終わった