最終レポート課題
【実行環境】
OS Windows 10 Pro 64bit
エディション Windows 10 Pro
バージョン 20H2
インストール日 2020/12/17
OS ビルド 19042.985
エクスペリエンス Windows Feature Experience Pack 120.2212.2020.0)
CPU
Intel Corei9 7940X 3.10GHz
RAM
Corsair CMK32GX4M2A2666C16 × 8(128GB)
(その他の構成については割愛)
レポート課題1.階層の可視化
用いたツール:SequoiaView
使用したフォルダ:リムーバブルディスクJ
【可視化したデータのスクリーンショット】
https://scrapbox.io/files/61f7c692ed93490022d1a9f0.png
可視化したデータの概要
主にテレビ番組の録画データを保存するサーバー用途のHDDを可視化。中には複数のディレクトリが存在し、その中に細かいファイルが入っている仕様。
今回は、拡張子毎に色分けし、どのファイルがどの程度の割合を占めているかに重点を置いた。
【拡張子の色分け】
緑:TSデータ(主に録画データ)
青:ARWデータ(主にカメラで撮影したRAWデータ)
赤:FLACデータ(主にインポートした楽曲データ)
【結果からの考察】
今回の目的はディレクトリごとにどの程度TSデータが存在するかであった。録画データにも30分枠や1時間枠など、容量が異なるデータがかなり存在し、更にはクールごとにフォルダ分けしているため、どのクールにどの時間の番組が多いかを判断できることは、ファイル管理に直結していると考えている。
今回、番組時間を面積で表せることによって、情報量の視覚化が容易にできるようになった。階層ごとに分けられることにも意味があることに気づいた。
一方で、改善点も多くある。ディスクの容量が大きいと読み込みに時間がかかるのは当たり前だが、初期値で色付けに対応していない拡張子が非常に多く、自身であとから追加しなければならない点が面倒だった。
また、拡張子ごとに色分けできるのはありがたいが、同一拡張子でも大きさによって色を変更できないと、同じ拡張子のみが存在するディレクトリは判断がしにくい。
レポート課題2.ネットワークデータの視覚化
用いたツール:Cytoscape
【可視化したネットワークのスクリーンショット】
https://scrapbox.io/files/61f7c9971139e800222a6948.png
可視化したデータの内容
主に音楽ジャンルにおける、つながりを表すネットワーク
大本となる音楽ジャンルから派生したジャンルがどのように影響しているかを紐付けで考察する。
【ジャンルごとの色分け】
赤:Hiphop系列
桃:Hardcore系列
青:Break系列
※今回は自身の興味のあるジャンルのみをネットワーク化。その他のジャンルを挙げてゆくと切りがないので割愛
【結果からの考察】
HipHopは様々なジャンルの根本となるジャンルだが、ネットワークを見ると、ほか2つのジャンルにしっかりと影響していることがわかる。
ネットワーク化することによって、曖昧になっている音楽ジャンルがどのジャンルの要素を含むかわかりやすくなっている。
1つ好きなジャンルがあれば、他の好きになる可能性があるジャンルを探し出しやすい。
【感想】
必ずしもそのジャンルが、派生元に似るとは限らない。
日々増え続ける音楽ジャンルに対応するのは難しいと感じる。
レポート課題3: 視覚化が不調な情報の考察
【うまく視覚化できていないデータ】
健康状態にまつわる数値など
【問題点】
「など」と評したのは複数の数値に共通する問題点があるからである。
例えば「数値の正常範囲(X.XX~Y.YY)の範囲外は異常とみなす」などと表記があっても、その数値が自身の体にどのように影響するのかをビジュアル化するのは難しい。
例えば食事などで(ZZZZ.cal)とカロリー表記があっても、実際どのくらいのカロリーなのか分かりづらい。糖質N%OFFなどの表記も同様。
【問題点とした理由】
健康状態はしきい値が人それぞれのケースも多く正常な範囲以外をどのように表すのかが問題点
e.g. 肝機能が低下しているなどでは分かりづらい。
カロリーや糖質も制限をするなどがトレンドだが、実際体に影響があるかどうかを判断しづらい。
【改善点】
かならず解決することは難しいが、問題点を一般化して解消することはできると思う。
e.g. アルコールの分解にm時間かかっていたのがo時間増える
カロリーを身近な食べ物に置き換える(1000calはステーキn枚分など)
もしくは、CG等による症状の視覚化などが挙げられる。