インクルーシブデータ集めマニュアル
※前回の記録から引用
ターゲット(誰に)
社会の見取り図を持ってないまま社会に放り出されてしまいそうな若者
メッセージ(何を)
注意すべき点
ありのままの現実を突きつけられると傷つくこともある
自分より良い生活をしている人がいると知ると妬む
細分化しすぎるとジャストミートすることがある
解決案
自分が一人ではないことを示す
ネクストアクションを提示する
細分化しすぎない
インクルーシブチャートづくりの目的(復習)Koichiro Shiratori.icon
裕福か貧困かといった単純化した見方ではなく、多様な視点によって社会を見られる「模型」をつくり、多様なまま生きていくしかないことをみんなで共有する
防窮訓練を受けている人や、インターネット検索でたどりついた人などが利用する
インクルーシブチャートの概要Koichiro Shiratori.icon
日本社会が100の星からなる星空だったら? 1%の人口が1つの星で表現される
日本在住の全員の完全なデータが入手不能なので、実データを参考に作った仮想人物(ペルソナ)100人の「模型」
所得以外にも多数の指標があり、属性がある。健康状態、友人関係、可処分時間……※どれかだけが重要なわけではない
ボタンなどで切り替えて表示できるようにする?
(時間の概念:指標や属性は年を追って変化する(動くバブルチャート?)……※1時点の1指標だけで「成功」や「失敗」を判断するのは視野が狭くないだろうか?)
自動で推移+スライダーなどで手動切り替え
カーソルを重ねると詳細がポップアウト? 「これ自分だ……」ボタンを押せる?
データ集めの方法Koichiro Shiratori.icon
以下、収集用にGoogleスプレッドシートを作成しましたFukushima Masayo.icon
①既存の各種調査から、日本社会の各種データを調べる
分布(平均、ばらつき(標準偏差)など)がわかるとよい。より細かい情報(ヒストグラムなど)があるとさらによい
②既存の各種調査や論文などから、変数間の関係を調べる(例:年齢が高いほど健康状態が悪いなど)
どの程度の関係の強さか(相関係数など)もわかるとよいが、どこに書いてあるかわかれば後で検討できる
見つけたデータの出典の表記方法
報告書などの名称+記載者(分かる人はアイコンで可)+報告書などの著者+URL+見るべきポイント+その他
例)満足度
「満足度・生活の質に関する調査」に関する第1次報告書Koichiro Shiratori.icon
内閣府 政策統括官(経済社会システム担当)
ポイント:総合主観満足度についての詳しいデータがある。属性別の総合主観満足度の分析もあり(p.4~)、60代以上になると急激に満足度が高くなっているなどのポイントは興味深い。また、世帯年収が高ければ総合主観満足度が単純に高いわけではないことは極めて重要ではないか
指標の例
お金
所得
就労状況
職業の選択肢(選択できないのはつらい、田舎における職業の選択肢は少ない)
健康
障がいの有無、ありよう
時間
可処分時間
自由にできる時間がペルソナによって異なるはず(例:ワンオペor親が近くにいる)
対人関係
所属するコミュニティの数(社会との接点の数、例:職場と家庭だけ)
教育機会(スキルアップする場へのアクセス(社会人))
環境
自然環境(都市と地方)
インフラ(水道、ガス、電気、交通、インターネット環境)
主観的満足度
「満足度・生活の質に関する調査」に関する第1次報告書Koichiro Shiratori.icon
内閣府 政策統括官(経済社会システム担当)
ポイント:総合主観満足度についての詳しいデータがある。属性別の総合主観満足度の分析もあり(p.4-)、60代以上になると急激に満足度が高くなっているなどのポイントは興味深い。また、世帯年収が高ければ総合主観満足度が単純に高いわけではないことは極めて重要ではないか
ペルソナの名前、ライフストーリー? (イメージしやすくする)
属性の例
年齢
性別
婚姻状況
子どもの人数
職業
学歴
居住状況(独居、世帯人数)
ルーツ(国籍?出身?)
変数間の関係
収入×総合主観満足度
収入が高くなると総合主観満足度も上がるが、高収入過ぎると総合主観満足度が下がる傾向
「満足度・生活の質に関する調査」に関する第1次報告書(p.6-)Koichiro Shiratori.icon
内閣府 政策統括官(経済社会システム担当)
気づいたことなどのメモ
複数の指標(軸)でマッピングするにはそれぞれを同時に含むデータが必要
「年齢(横軸) X 収入(縦軸)」なら年代ごとの収入の平均と標準偏差があれば擬似的にデータ生成できる
「年齢(横軸) X 収入(縦軸) X 可処分時間(スターの大きさ)」なら年代ごとのそれぞれの収入ごとの可処分時間のデータが必要 →3つ以上の要素を同時に含むデータありそうか?
ペルソナをどうやって決める(データ生成する)?
属性は相関があるため、軸と同様に、複数の属性の同時確率分布が必要? 例えばもし性別・年齢ごとの既婚率データしかなければ「男性 X 30歳 X 年収800万円」の人の既婚率と「男性 X 30歳 X 年収400万円」の人の既婚率が同じになってしまう。
議員ペディアは全ての議員の全ての属性が明らかなため、任意の軸に投影することができる。これの全国民版なら、全国民からランダムに100人抽出して、全ての属性を知ることができれば議員ぺディアと同じことができる。
仮に全国民の分布に不正確でも断片的なデータからありそうなペルソナを作ったとして、ステレオタイプにならないか? (例. 男性・上場企業・家族4人)。全体で見た時に複数の属性の割合が分かっても、個々のペルソナの多様性は失われてしまう可能性がある。マジョリティ・マイノリティ共にそれぞれいろいろな人がいることが抜け落ちてしまう?
「世界が100人の村だったら」では、全世界の人々を100人にした時、「47 人は農村に,53 人は都市」、「1 年のあいだに75 人は 20 キロの,25 人は 80 キロの肉を食べる」のように、属性ごとの割合を示している。同時属性は示していない。
yuiseki.icon
N個の属性のそれぞれの相関の情報
N次元空間ベクトルとして表現できる?
https://gyazo.com/de50065fd5549280d1d5bf61d85c774d
N個の偏差ベクトルと平均値ベクトルがあれば、N次元空間ベクトルを再構築できる(情報としてMECE) 相関がない(わからない)場合は、直交する
相関がある場合は、ベクトルの角度として計算できる
https://gyazo.com/f29dcc664edc0aebac2bd91d4a782cf0