確率分布
確率分布とは?
›確率変数の各実現値に対して、確率を割り当てたもの。
例えば、サイコロを一回ふったときの出る目の確率分布は
1→1/6 2→1/6 3→1/6 4→1/6 5→1/6 6→1/6 それ以外→0
各実現値1、2、3、4、5、6に、このように確率が割り振られる
サイコロの確率をXとすると確率変数Xは各実現値1,2,3,4,5,6に対してそれぞれ1/6という確率が割り当てられている確率分布に従う
また、離散型確率分布と連続型確率分布の2種に分けられる。
参考サイト:【統計学の入門サイト】統計ドットリンク
離散型確率分布・・・離散的データを生成する分布です。離散的データとは、個数、性別、正・誤であらわされるデータである。そしてこの確率は特定の値が出る確率である。
〇種類と役割
二項分布
2つに1つの結果となる試行を行った時の、成功数を表す分布 ex)コインの裏表でのn回投げた時に何回成功するかを表す分布
https://gyazo.com/877d6b4454fa4a430cae21320e61ce59
ポアソン分布
まれにしか起きないような出来事の発生確率や回数をあらわす分布 ex)ある街での交通事故に遭う人の確率モデル
幾何分布
成功・失敗や表・裏など、2つに1つの結果となる試行を行った時の、成功数までに必要となった回数を表す分布 ex)コイン投げをし始めてから、最初に成功する(表が出る)までの試行回数をあらわす分布
離散型一様分布
一様分布のうちで、対象が離散型データである場合、離散型一様分布
一様分布とは確率変数の値がどんな値でもそれに関わらず、確率密度関数が一定の値をとる分布
離散型データとは、人数や個数、枚数などのように数えることができるもの
連続型確率分布・・・重さや速さ、強さのような、赤と青のように区別できないデータを連続的なデータとして、そのなかで範囲を設けて、その範囲内を満たす確率をいう。例として新生児の体重の基準を28~32キログラムとして、実際に100人の新生児を調査した時の基準を満たす確率は?というものが挙げられる。
〇種類と役割
正規分布
中央が一番頻度が大きく、左右対称で滑らかで美しい形で、平均値と中央値と最頻値が同じであり、釣鐘や富士山の形のような分布である。ex)自然現象や社会現象は正規分布と似た形をとりやすい
https://gyazo.com/0a5463d619452579eeaa06f927d87751
指数分布
ポアソン分布に従う事象が発生するまでの待ち時間の分布 ex)一日8人のスタッフで出産対応する病院の出産数分布としてのポアソン分布があると、次に出産するまでの時間間隔が従う分布が指数分布となる
左がポアソン分布 右が指数分布
https://gyazo.com/cf80a3993c28bddc5db5ad76ca91f990
連続型一様分布
一様分布のうちで、対象が連続型データである場合のもの
一様分布とは確率変数がどんな値にも関わらず、確率密度関数が一定であるもの
連続型データとは身長や体重など観測値や時間のようなものがあり、数えることができず連続なもの
カイ二乗分布:標本の平均値を0、標準偏差を1と変換した分布でのデータ、これを基準化変量といい、これを二乗して足し合わせたものが従う分布。自由度によって分布が変わる。
役割としては標本から得られたデータが、理論値や期待値に適合するかどうかを検証する場合や、分割表において、AのカテゴリーBのカテゴリーがあった場合に、それぞれが依存していなくて独立であるかどうかを検定するときに使われる。そして、自由度というのは自由に値をとれるデータの数で、この表の分割表で言うと、独立に決定するセルの数によって定まるものである。公式としては縦列の数をx、横列の数をyとすると、(x-1)(y-1)となる。これは縦列と横列のそれぞれの合計がわかっているので、各1列を減らした残りのx-1列とy-1列によって定められるのである。詳しくは下の参考リンクから
https://gyazo.com/29232b0bb4ff652a0369bf3caf8b2775
https://gyazo.com/9e4937b6b83a0fa24845480ddc82e7c7
自由度:to-kei.net カイ二乗検定の自由度(分割表の自由度)