Parquet
Apache Parquetは、データを保存する形式のひとつです。よくわからん、という人はとりあえず「すごいCSVファイル」みたいなものだと思って..
データ・フォーマット ディスク上でカラム型データを効率よく記録する。言語非依存?共通で使える?形を目指してる。
Parquetはファイルフォーマットでしたが、Apache Arrowはインメモリ列指向データフォーマットです。
sparkly (Rのspark用library)だといけるよう。
以下は古いかも
apache/arrow側のbinding?の用意ももうすぐ?(bindingがどういうものかはわかってない, interfaceみたいなものができる?)
outputは、
直接はまだない。