統計学
en: statistics
数理的な統計モデルを扱う学問。
「統計科学」という別名で呼べるのか?wint.icon
疑義
モデルを利用してないなら科学ではないのでは?
cf. 科学の定義
確率モデルのモデルを使ってるのでは?
でも自然主義なら科学と連続してるのでは?
それは数学的な理論と実践とを区別しないと言えない。
cf. 数理統計学
基礎
randomness と確率論を基本にしている。
uncertainty(不確実性)を基礎とすることも
分類
記述統計学
統計量などで要約できたら十分
→ 記述統計
推計統計学
aka. 推測統計学
高々有限サイズ有限回のサンプル(標本)から推定・推測・推論したい。
観測済みデータ → モデル = モデル → 未観測データ
sampling
統計モデル (statistical model) を つくる (statistical modeling)
哲学的には、自然の斉一性を確率モデルの斉一性として定式化した上で、帰納推論を数学的に精緻化した概念だ と見れる という。
ref. 『統計学を哲学する』 #統計学の哲学
別軸
基礎統計学
aka. 数理統計学
応用統計学
統計モデルのモデリングの手法
推計統計のため
大別して2つ
nonparametric 統計
parametric 統計
さらに制約を加える
いろいろな分布族
この分布族を自然種として扱える。
推測統計学
確率の解釈(帰納推論の認識論)ごとに流派が分かれる。
推測統計の諸流儀
ベイズ統計
確率変数は論理式だという
Q. 確率論理式?wint.icon
いわゆる主観確率
コンピューターによって実用的になったらしい。
仮説は更新するモノ
aka. ベイズ統計学
en: Bayesian statistics
ベイズ推定
#ベイズ
古典統計
e.g. 検定理論
検定についての理論
仮説について ではない
帰納行動 by ネイマン
推測統計の古典
いわゆる頻度論、頻度主義
相対頻度 (en: empirical frequency)
仮説は棄却するモノ
aka. 頻度主義統計学
en: frequentist statistics
頻度主義的推定
検定は2値の確率分布
parameters: α, β
size α
ref. Size (statistics) - Wikipedia
power β
モデル選択
en: model selection
⊂ 理論
もっとも予測能力が高いモデル(= 確率種)を選び取りたい。
⊃ 赤池弘次の理論
例
赤池情報量規準
by. 赤池 弘次
abbr. AIC
下に
指標の候補
尤度: ❌
問題
過剰適合、過適合、過学習
未知のデータには無効
AIC
平均尤度(期待値)に着目する。
補正項
モデルの複雑さにペナルティーを与える。
深層学習
予測重視の極地
説明性がトレード・オフに なりがち
cf. XAI
スタイルいろいろ
スタイルの比較
ベイズはパラメーターが変化するので、そのためのモデルがあり、そのためのパラメーター(= ハイパーパラメーター)がある。wint.icon
ref.
https://twitter.com/genkuroki/status/1339613121376256003
@genkuroki: #統計 統計学を「頻度論」と「ベイズ」のように主義で分類すること自体が有害な上に、主義の違いによって、定数と確率変数のどちらになるかが決まると考えることが極めて有害。
その代わりになりそうな考え方を書いておきました(試案です)↓
https://pbs.twimg.com/media/EpdDB60VgAASds2.jpg
注意
すべてのモデルは間違っている
推計統計学?の概念
変量
母集団(構造)が持つ関数
sample point → number
確率モデル
措定した存在物
概念
尺度水準
en: level of measurement
水準の低い順(構造の貧相な順)
名義尺度
equalable
順序尺度
+orderable, comparable
間隔尺度
+加減算
比例尺度
+乗除算
推論
パラメーター空間からパラメータの部分集合を特定すること。
パラメーター空間
モデルの とり得るパラメーターの集合
統計モデルを決めると定まる。
WAIC/WBIC
実は頻度論らしい。
推定量
統計的仮説
分布族ならパラメーターの仮説に帰着できる。
尤度
en: likelihood
パラメーターの仮説の データに対する もっともらしさ。データに対する仮説の 尤も らしさ。
データを固定して、パラメーターの関数に なる。
cf. 尤度関数
尤度が小さいからって、ただちに確証も反証も しない。モデルに相対的なので、比較しないと 言明に ならない。
対立仮説も見よ。 #古典統計
大小
説明力の指標になる。
予測能力の指標にはならない。
未来のデータは観測されてないので
population correlation coefficient
ja: 母相関係数
措定された確率モデルのパラメーター。観測される ことは ない。
#相関係数
事前確率
最初に任意に設定する確率分布。
この設定の巧拙に職人芸があるとかないとか。wint.icon
ベイズ統計に特有。
関連
基準率錯誤
en: base rate fallacy
#誤謬
無情報事前分布
en: non-informative prior
i.e. 一様分布
e.g. フェアなコイン、フェアなサイコロ
ひとしい確率を割り当てる。
価値
正則化バイアス
過学習ないし過剰適合を回避するための道具
事後確率
更新された確率分布
現象
洗い流し
en: washing out
sample のサイズ(数。当然回数も)が増えるごとに確率分布が収束していくこと。事前確率のブレを補正できる。
論法
「このベイズ更新を無限に繰り返せるなら…」
余帰納法か?wint.icon
cf. 無限主義
仮説検定
流儀が2つある
Neyman と Pearson の仮説検定 #古典統計
parameter space を 2分割する。片方を帰無仮説として却下する。
仮説の正誤には直接は言及しない。
Fisher 流もある。
有意性検定
対立仮説を立てない、という。
流儀について
Ohkubo, Yusaku. (2019). p 値とは何だったのか (Fisher の有意性検定と Neyman-Pearson の仮説検定を超えるために). 生物科学 70(4), 238-251.
生物学研究においては古典的な統計的検定と p 値が主要な道具として用いられてきたが, アメリカ統計学会が「有意水準が満たされるか否かだけにあらゆる判断を委ねるべきでない」 という趣旨の声明を発表し反響を呼んでいる.しかしながら多くの生物学者にとって,p 値 に関して何が問題となっているのか理解するのは必ずしも容易ではない.本稿ではまず生態 学内部における論争を考察し,「p 値とはそもそも何だったのか」「統計的検定の目的とは何か」 までさかのぼって論じることが必要だと指摘する.またこれを踏まえ,Fisher の有意性検定 と Neyman-Pearson の仮説検定の相違点や二つの検定が生まれた背景を解説し,目的の異な る統計手法が混同されることの危険性について議論する.
cited as https://twitter.com/kenmcalinn/status/1739858205252165752
棄却域
標本空間の部分集合$ C⊂Ω
事前にさだめて帰無仮説を対立仮説かを判断するためのサンプルの集合ないし範囲
#仮説検定
これで検定関数を定める。
$ ψ: Ω → \{H_0,H_1\}
$ = Ω → 2
検定の誤り
2種
第一種の誤り
aka. false positive
ja: 偽陽性
確率$ α
size
(of a test)
ref. Size (statistics) - Wikipedia
def. 上の上限
aka. 有意水準
制御可能
$ 1-α: 信頼率
第二種の誤り
aka. false negative
ja: 偽陰性
確率$ β
$ 1−β: 検出力
trade-off の関係にある。
α vs β
同様に 1-α vs 1-β
p値
データ以上に極端な値が出る確率。帰無仮説の ありえなさ。
p-value function なる手法が あるらしい。
ref. https://twitter.com/genkuroki/status/1567880547648827397
https://nbviewer.org/github/genkuroki/public/blob/main/0036/P-value%20functions%20of%20proportions.ipynb
上記以外のモノ
ref. https://doi.org/10.1080/00031305.2018.1556735
モデル適合
en: model fitting
aka. 学習
結果
適合モデル
いわゆる curve fitting を考える。
ja: 曲線あてはめ
モデルの正当化は考えない。
単なる fitting でしかない。
赤池情報量規準
#TODO
平均尤度をうまく補正する。
ref. 赤池情報量規準 - Wikipedia
統計的因果推論
手法2つ
反実仮想モデル
構造的因果モデル
因果グラフ
⊂ 有向グラフ
DAG を考えることが多い。
変数集合が2変数の因果を媒介することがある。
open: する場合
block: する上で、相関させなくなってる状態
def. or条件で定義される。省略。
関係をなくした場合
def. 有効分離、d-分離
直接原因
abbr. dc
グラフの直接の上流の変数たちの集合のこと
課題
得られるのか?
→ 因果探索
因果的マルコフ条件
有効分離された変数は独立になる。
$ X \perp_G Y \mid Z \implies X \perp_P Y \mid Z
$ ≡ X\mathrel{⫫}Y \mid Z
因果的に切断される。
構造方程式
忠実性条件
因果的マルコフ条件の逆
$ X \perp_G Y \mid Z \impliedby X\mathrel{⫫}Y \mid Z
仮定の一種
介入
これをグラフで定式化できる。
介入できるなら原因である。
原因でなくする。
可能世界を現実において実現するモノと言える。
余計な変更はしない。
vs. したら fat-hand である。
手法
do計算
介入前の情報だけで介入後の結果を予測できる。
バックドア基準
介入に都合がいい共変量を選ぶ基準
変量
en: variate
多次元版も ある。
ja: 多変量
en: multivariate
信頼区間
ref. 『新版 統計学のセンス』は統計学を「使う」人なら必携の書 - 渋谷駅前で働くデータサイエンティストのブログ
手法
最尤法
⊂ モデル適合
結果
最尤推定量
aka. 最大尤度
en: maximum likelihood estimator
abbr. MLE
技法
対数尤度
計算を簡単にするため
結果: 最大対数尤度
課題
高次元では解析的に解けない。
数値的に解く必要が出る。
最小二乗法
⊂ モデル適合
回帰
⊂ 推測統計
予測に使えるので
回帰モデル
説明変数
目的変数
モデル
parametric
線形…
ベイズ更新
ベイジアンな統計モデルで使う。
仮説検定
反事実的な手法
無作為化比較試験
en: randomized controlled trial
abbr. RCT
因果推論の 1手法
平均処置効果を見るために人工的に独立にする。
自然実験が可能なことがある。
説明変数以外が同じモノをペアと考えられる。これを他の可能世界の代わりに使える。
現実には無理
条件つき独立にできれば十分
def. 強く無視できる割り当て条件
i.e. 交絡因子
i.e. 傾向スコア
反実仮想モデル
en: counterfactual model
#counterfactual
傾向スコアを採用する。
柔軟性や予測性能が上がる。
課題
共変量選択の問題は残る。
ここから哲学
意味論
還元主義を とらない。
可能世界に よって 理解する。
デイビッド・ルイス流の意味論
構想的因果モデル
因果グラフを使って推論する。
介入
可能世界間の確率分布の写像
最適輸送が応用できるらしい。
do計算
介入の効果を予測できる。
平均処置効果を計算できる。
因果探索
忠実性条件からグラフ構造を逆に推定できる。
絞り込めても確定できない場合もある。
非忠実(en: unfaithful)な分布でも無理。
問題
周辺化パラドクス
ベイズ統計における問題
Bayes factor が さだまらない。
書籍
入門書(統計学の入門書)
黒木 学『数理統計学』
『標準 ベイズ統計学』2022、朝倉書店
Peter D. Hoff (2009) A First Course in Bayesian Statistical Methods の日本語訳
#ベイズ統計学
ベイズ統計学 |朝倉書店
https://pdhoff.github.io/book/
ref.
統計学 - Wikipedia
Statistics - Wikipedia
Template:Statistics - Wikipedia
Bayesian statistics - Wikipedia
Statistical inference - Wikipedia
https://en.wikipedia.org/wiki/Statistical_inference#Paradigms_for_inference
Frequentist inference - Wikipedia
Bayesian inference - Wikipedia
Fiducial inference - Wikipedia
ベイズ統計学入門 〜頻度主義からベイズ主義へ〜 - Speaker Deck
統計モデル - Wikipedia
Glossary of Statistical Terms / SticiGui / Department of Statistics / UC Berkeley
Bayesian probability - Wikipedia
ベイズ確率 - Wikipedia
Bayesian epistemology - Wikipedia
Statistical hypothesis test - Wikipedia
((統計的)仮説)検定
第一種の過誤 | 統計用語集 | 統計WEB
第二種の過誤 | 統計用語集 | 統計WEB
P値 | 統計用語集 | 統計WEB
#応用数学