分散
これを考える
data1: 1,2,3,4,5,6
data2: 3.5, 3.5, 3.5, 3.5, 3.5, 3.5
「平均値から各データの差の2乗を全て足した値」の平均値
これが分散
q: なんでこんなよーわからん計算をしている?
「平均値から各データの差を全て足した値」の平均値
まずは「平均値から引いてみたらばらつきわかるよね」という単純な発想を考えるよね
偏差という
マイナスの値もでちゃうから、すべて足すところで打ち消しが起きてしまう
たしかに?sta.icon
このページの末尾に証明がある
「平均値から各データの差の絶対値を全て足した値」の平均値
んじゃあ絶対値にするか?
平均偏差と呼ぶ
これが大きいこそばらけてるとわかる
でも数学的に面倒くさいらしいよ
しかし、絶対値の計算は絶対値記号を外すために場合分けをする必要があり、数学的に面倒であるというデメリットがあります。
ああ、プログラミングレベルで言えば if 使うことになるもんな
ああ、だから絶対値計算なくすために「二乗するか」ってしたわけだsta.icon*2
それが分散
なるほどsta.icon
頭ええやん