統計学
統計学が最強の学問
Statistics is Most important
第1章 なぜ統計学が最強の学問なのか?
どんな分野の議論でもデータを分析することで最速で最善の答えが出せる
統計学はエビデンスが出せる
ITと結びついて花が開いた
第2章 サンプリングが情報コストを激減させる
ビッグデータを全て解析するのはコストがかかりすぎる
サンプリングをして誤差を求めれば良い
第3章 誤差と因果関係が統計学の肝
・何らかの要因が変化すれば利益が向上するのか
・そうした変化を起こすような行動は実際に可能なのか
・変化を起こす行動が可能だとしてもその利益がコストを上回るのか?
データをビシネスに使うにはこの3つの問いに答えることが大事
実際には何の差もないのに誤差や偶然によってたまたまデータのような差が生じる確率をp値と呼び、5%以下を目指せ
また、適切な比較をするのも大切
比較している集団がフェアじゃないので因果関係がわからない
わからなくても仮説を立てられるので有望
これに対する解決策は、「考えられうる条件を考え、その条件ではフェアに比較」と「データの取りかたの時点でフェアに揃える」という2パターンある
第4章 ランダム化という最強の武器
人間の制御しうる何事においても因果関係を推論できるのでランダム化実験はすごい
誤差への3つのアプローチ
・実際のデータを全く扱わず、仮説やこういう事例がありましたというものをもとにして理論モデルを作る
・うまくいった事例のみを報告
・ランダムかを用いて因果関係を確立的に表現する
ランダム化の3つの限界
現実、倫理、感情
第5章 ランダム化できなかったらどうするか
揃え切れていない条件にどこまでこだわるべきか
t検定、カイ二条検定、分散分析、回帰分析は全て一般化線型モデルという広義の回帰分析の考え方で統一的に理解できる
データの関係性を記述するのが回帰分析という考え方
得られた回帰係数にもばらつきが存在するという考え方
フィッシャーはたまたまデータから得られた統計量がどの程度の誤差で真値を推定しているかを数学的に整理することで無限にデータを集めることなく適切な判断が下せるという考え方を示した
回帰係数の推定値:真値を推定した結果
標準誤差:推定値の誤差の大きさ
95%信頼区間:p値が5%以下となる真値としてはあり得ない値とならない範囲
p値:回帰係数が0だった婆にデータのばらつきだけでこの回帰系すうが推定されてしまう確立
説明変数と結果変数さえ決まれば、用いるべき分析手法は簡単に選べる

どの方法でも同じp値が得られる
性別によって点数が平均的に何点異なるのかを推定すれば層別に分けなくても良くなる
複数の回帰係数はお互いに相乗効果がなかったと仮定した場合の値である
もともと0か1かという二値の結果変数を変換し、連続的な変数として扱うことで重回帰分析を行えるようにしたのがロジスティック回帰の大まかな考え方である
回帰モデルを使うときは交互作用に注意する
第6章 統計家たちの仁義なき戦い
①実態把握を行う社会調査法
②原因究明のための疫学・生物統計学
③抽象的なものを測定する心理統計学
④機械的分類のためのデータマイニング
⑤自然言語処理のためのテキストマイニング
⑥演繹に関心を寄せる計量経済学
第7章 巨人の肩に立つ方法
メタアナリシス、系統的レビューが最高のエビデンス
最高の答えは公開されている
「基礎統計」
統計の基礎
本講義では、初めて統計学を学ぶ学生を対象に、データ解析・統計学の考え方と実際について、その基本事項を解説する。対象は文理を問わない。専門学部で諸科学を学ぶ際に特に重要な、確率分布(=現象のモデル化)、独立同一分布性(=同一条件の下での繰り返し実験)、統計的推測(=データから母集団への推論)の考え方を理解することに焦点を当てる。
1. 1次元データの整理・要約
(平均、分散、標準偏差、基準化、歪度、尖度など)
2. 2次元データの整理・要約
(共分散、相関係数、回帰直線など)
3. 確率
(確率、条件付確率、事象の独立など)
4. 確率変数と確率分布
(確率変数、確率分布、期待値、確率変数の平均と分散、Bernoulli 試行、2項分布、Poisson分布、幾何分布、正規分布、指数分布など)
5. 独立同一分布
(同時確率分布、独立同一分布、和の分布など)
6. 統計量
(母集団、標本、標本分布、正規母集団、中心極限定理、大数法則など)
7. 標本分布(母集団と標本の概念、統計量、標本平均の平均と分散など)
8. 統計的推定
(点推定、区間推定、不偏推定量など)
9. 統計的検定論
(正規母集団に関する検定、2項母集団に関する検定、カイ2乗検定など)
———————————————————————
「数理手法1」
内容:
1. 確率・確率分布・確率変数(1)。「確率・統計I」1-2章。
2. 確率・確率分布・確率変数(2)「Excelによる確率入門」3章。
3. パソコン・Excelの使い方の復習。「Excelによる統計入門」1-4章。
4. データの整理と記述統計の演習。「Excelによる統計入門」5-8章。
5. 大数の法則と中心極限定理。「確率・統計I」3章。
6. 標本分布、推定と検定。「確率・統計I」4,5章「Excelによる統計入門」11-12章。
7. 回帰分析。「確率・統計I」4,5章「Excelによる統計入門」13章。
受講者は、教養学部の「基礎統計」を履修したか、同等程度の確率・統計の知識があることが望ましい。「基礎統計」を履修していない学生は、東大教養学部編「統計学入門」などで、その基礎を復習視しておくこと。
教科書は、
縄田和満著、「確率・統計I」東京大学工学教程、2013年、丸善出版。
縄田和満著、「Excelによる統計入門(Excel2007対応版)」、朝倉書店、2007年
である。参考書は、
東大教養学部編、「統計学入門」、東大出版会、1991年
縄田和満著、「Excelによる確率入門」、朝倉書店、2003年
である。
確率・統計
Excel
—————————————————————————————————————————
ヨビノリ統計学
第1講 母集団と標本

第2講 点推定



第3講 区間推定(分散が既知)





第4講 区間推定(分散が未知)




第5講 区間推定(母集団分布が未知)




第6講 母比率の推定




第7講 母分散の推定




第8講 母平均の推定




第9講 ウェルチの検定




チェビシェフの不等式




中心極限定理


ベイズの定理



ベイジアンネットワーク



------------------
統計検定1級
Statistics Test 1 Kyu
「統計検定資料」
統計検定1級に合格
———————————————————————————————
「統計検定1級に合格する方法」
確立分布の扱いに習熟することが大切
すうり統計学に立脚した検定論・推定論を腰を据えて学ぶ
理工学を選ぶべき
——————————————————————————————
「統計検定準1級に合格するための方法」
--------------------------------------------------
確率統計
Probability Statistics

1 確率の基礎
2 確率変数
3 多次元の確率分布
4 推定と検定
5 異なった母集団の同一性の検定とF分布
6 回帰分析
7 ベクトルと行列を使った回帰分析
————————————————————————
確率統計2
1 実験計画法
2 時系列解析
———————————————————
確率統計3
1 統計モデルと尤度
2 推定
3 検定とモデル選択
4 確率の基礎
5 Markov連鎖
6 Brown運動と確率積分
7 伊藤の公式と確率微分方程式
8 拡散過程