〈T1〉可視化の手法01:グラフ
グラフにはどのような種類があるか?また、どのように使い分けに留意すべきか?
グラフの種類
棒グラフ
円グラフ
折れ線グラフ
積み上げ棒グラフ
100%積み上げ棒グラフ
散布図
→以上のグラフについて、以下で検討する。
棒グラフの特徴
データの大きさを、棒の高さで表す。
https://gyazo.com/3cc76db424cfe7f3e5e839a1efd9d201
上の画像のように、データの大きさを容易に比較することができる。
以下でも紹介するが、折れ線グラフとともに用いることで、時系列のデータ推移を表すこともできる。
円グラフの特徴
データの大きさを全体の円に対する割合で表す。
棒グラフとの大きな違いは、棒グラフが数量を単位ごと(人数等)で表すのに対し、円グラフは割合(%)で表す点。
https://gyazo.com/621528e407225315000c6bb76f45b950
上の画像のように、割合で示すことで、データの量が膨大でも、一目でその割合を理解することができる。
なお、円グラフとは別に帯グラフというものもあるが、これは円グラフを帯状で表したものである。
折れ線グラフの特徴
主に、時系列における変化を表すときに使用される。
https://gyazo.com/cc8750a7462d8f859a23610899fbdcc6
上のグラフは、私が別の科目のレポートに記したグラフである(そのため引用表記は省略)。
グラフの通り、時系列に沿って数量の変化(このグラフでは人口)を表すことで、いつ、どのような変化が起こったかが明らかとなり、その背景やデータの分析に役に立つことがある(このグラフからは、ベビーブームに伴う人口増加と、東京江戸川区への人口流入を結び付け、1960~1970年にかけ大幅な増加があるということがわかる)。
なお、棒グラフと組み合わせることで、より視覚的なグラフに仕上げることも可能。
複数のデータをグラフに表すことも可能。それにより、あらゆる種類のデータについて、同じ状況下の数量の変化について分析することができる。
積み上げ棒グラフの特徴
棒グラフの中で、全体の数量に対してどの要素がどの程度を占めるのかを数量ごとに表す。
https://gyazo.com/8f189cddd2a92d55b81eae25752fd5f6
100%積み上げ棒グラフの特徴
一言でいうと、縦にした帯グラフ。
積み上げ棒グラフは凸凹であるが、100%積み上げ棒グラフは平坦である。前者が数量を表すのに対し、後者は棒グラフに対する割合を表すためである。
グラフ作成のときに気を付けなければならないこと
どのグラフを用いるのかが最も適切か考えなければならない。
遠近法を使ってごまかしてはいけない(某予備校のグラフは、時系列で用いるべきデータを棒グラフで表し、あろうことか遠近法を用いて、合格者減少をごまかしていた)。
相互比較できないデータ・数量を同一のグラフに表示してはならない。
目盛りの表現が適切ではない(400前後で動いているものを、395~410の目盛りで表しているが、実態は誤差の範囲であるため、0~500の目盛りで表すべき場合など)
散布図
2つの要素からなる1組のデータが得られたときに、2つの要素の関係を見るためにプロットしたグラフのこと。
https://gyazo.com/9a800083be2f617b3068d004ec08708f
上の表をもとに、散布図を作成する。森林面積割合と人口100万人あたりの博物館数という2つの要素からなるデータの関係性をみることができる。
また、この散布図から何かしらの関係を見いだせる場合、データ間に「相関関係」があるということができる。グラフが全体的に右上がりの場合「正の相関」が、右下がりの場合「負の相関」があると認めることができる。なお、上記の引用したグラフについては、そのような相関は見られないと判断できる。
【参考】