Power Queryでのテーブルの結合
本ページの内容は、Windows版のExcelでしかできない可能性があります(Mac版は見た目も異なり、一部機能がなかったりする可能性があります)ので、注意してください。
テーブルの結合
縦持ちにした「テスト結果」のテーブルは、「科目」という質的変数(ディメンション)と、「点数」という量的変数(メジャー)で構成される
https://gyazo.com/ab0145035cd89df324a8e62eeb1c2150
(なお、「学生ID」もディメンションではあるが、個々の学生を識別するためだけの名義尺度であり、分析の切り口にはなりにくいので、ここでは意味のあるディメンションとしては扱わないものとする)
このテーブルでも「科目ごとの平均点」のような集計は可能だが、分析の切り口は「科目」しかない
ここで、別のシート「学生情報」には、学生ごとの「学年」や「ゼミクラス」の情報が入っている
https://gyazo.com/5fe7dd74bab1a5bcc8e5405dd52a362d
「学生ID」をキーとして照合することで、この「学年」や「ゼミクラス」を新たなディメンションとして切り口を増やすことを考える 「クエリのマージ」でテーブルをつなぐ
つなぎたい2つのテーブルをまずPower Queryで読み込んでおく
今回はすでに「テスト結果」はあるので、「学生情報」のみ新たにPower Queryで読み込む
https://gyazo.com/1db5fa371ae5fe968e81eb31d63fea05
「ホーム」タブの「クエリのマージ」を選ぶ
https://gyazo.com/d3f788215fc609b3eb83259b6b6dbe0f
2つのテーブルそれぞれについて、照合するためのキーとなる列を選ぶ
https://gyazo.com/9a3080bc1d4542f2a0d937d9c0b05f8d
結合したいテーブルが1つの列にまとめて表示されているので、これを展開する
使用したい変数(項目)のみを選択して展開できる
https://gyazo.com/cb5617740330b91f2fe18bfa34e76d54
これを「閉じて読み込む」ことで、結合済みのテーブルをExcelのシートに読み込める
https://gyazo.com/e91673a8bf942ef1528658750d0f24c6
前処理して準備したデータをそのまま集計・可視化する
これで、切り口(ディメンション)を追加した縦持ちデータが完成した
ピボットテーブルによるインタラクティブな集計
https://gyazo.com/a78e1286e723a25532d3ac42702d4981
https://gyazo.com/3bc32263b2778b65d504538500972cf3
ピボットグラフによるインタラクティブな可視化
https://gyazo.com/883136046d5803ca60dcfa5b268bf43e
(スライサーの使用↓)
https://gyazo.com/b43229dcb7d1fc88ad30ed8d6dabbebb
データクレンジングして「きれいに」した(とくに多くの場合縦持ちの)データを用いて、クロス集計したり、それをベースとしたグラフを描いたりすることが非常に多い
Excelであれば、ピボットテーブルとピボットグラフをしっかり理解しておくとかなり便利
クロス集計ベースで集計・分析するのはTableau等のBIツールや、R等のプログラミングでも同様なので、データの縦持ち・横持ちの感覚を正確に身につけてデータの準備ができるようになるととても応用がきく