SourceとSink
データ分析をやっていると、SourceとSinkという単語が度々出てくる。
Sourceは馴染み深いと思うが、情報ソースといった具合によく使われる用語である。データ分析のコンテキストだと、データレイクやオブジェクトストレージ、データウェアハウスなどに格納された処理前のデータを指すことが多い。
一方でSinkという単語は (個人的には) あまり馴染みがなかった。一般用語としてのSinkは、台所の流し台 (シンク) だったり、その他には 「沈む、沈める」 といった意味もある。
データ分析界隈では、Sinkは処理したあとのデータを格納する場所、という意味で扱われることが多い模様。各種データベースだったり、オブジェクトストレージ、データウェアハウス、あるいはデータマートを指すこともあるだろう。
#用語