データの性質と分析の関係
データの性質
データの性質によって、集計・可視化すべきものは異なる
データの尺度のページでは、大きく定性的データ(質的変数)と定量的データ(量的変数)の違いを説明しているが、この2つを明確に区別することが重要
分析対象となるデータが、どのような変数(項目、フィールド)を含むのか、またそのそれぞれが質的変数なのか量的変数なのかを把握しておくことが必要
Tableau等のBIツールや、Excelのピボットテーブル、RやPythonでのデータフレームに基づくデータ分析などにおいては、これを理解しておくことが上達のポイント
hr.icon
変数の数と性質による違い
着目する変数の数と性質(量的か質的か)によって、適切な集計・可視化の方法は異なる
1つの量的変数に関する集計・可視化
1つの質的変数に関する集計・可視化
2つ(以上)の量的変数に関する集計・可視化
2つ(以上)の質的変数に関する集計・可視化
これらの使い分けとともに、多次元分析の考え方を理解しておくことが重要
その他のパターン
時間(系列)の変数と1つの量的変数に関する可視化
折れ線グラフや面グラフなどで、量的変数の変化(推移)を可視化する
https://gyazo.com/91b32b3b8032b703d34afd741e06536d
横軸が時間(系列)の変数、縦軸が量的変数
その他
その他、独自の意味をもつデータを用いて、より特殊な可視化をすることもある
地理空間データ(都道府県、市区町村、緯度・経度などのデータ)をもとに、地図を用いた可視化をする
つながりを示すデータをもとに、ネットワークを用いた可視化をする
などなど