統計学 - wint

統計学

数理的な統計モデルを扱う学問。

「統計科学」という別名で呼べるのか？wint.icon

疑義

モデルを利用してないなら科学ではないのでは？

cf. 科学の定義

確率モデルのモデルを使ってるのでは？

でも自然主義なら科学と連続してるのでは？

それは数学的な理論と実践とを区別しないと言えない。

cf. 数理統計学

基礎

randomness と確率論を基本にしている。

uncertainty（不確実性）を基礎とすることも

分類

記述統計学

統計量などで要約できたら十分

→ 記述統計

推計統計学

aka. 推測統計学

高々有限サイズ有限回のサンプル（標本）から推定・推測・推論したい。

観測済みデータ → モデル = モデル → 未観測データ

統計モデル (statistical model) をつくる (statistical modeling)

哲学的には、自然の斉一性を確率モデルの斉一性として定式化した上で、帰納推論を数学的に精緻化した概念だと見れるという。

ref. 『統計学を哲学する』 #統計学の哲学

別軸

基礎統計学

aka. 数理統計学

応用統計学

統計モデルのモデリングの手法

推計統計のため

大別して2つ

nonparametric 統計

parametric 統計

さらに制約を加える

いろいろな分布族

この分布族を自然種として扱える。

推測統計学

確率の解釈（帰納推論の認識論）ごとに流派が分かれる。

推測統計の諸流儀

ベイズ統計

確率変数は論理式だという

Q. 確率論理式？wint.icon

いわゆる主観確率

コンピューターによって実用的になったらしい。

仮説は更新するモノ

aka. ベイズ統計学

en: Bayesian statistics

ベイズ推定

e.g. 検定理論

検定についての理論

仮説についてではない

帰納行動 by ネイマン

推測統計の古典

いわゆる頻度論、頻度主義

相対頻度 (en: empirical frequency)

仮説は棄却するモノ

aka. 頻度主義統計学

en: frequentist statistics

頻度主義的推定

検定は2値の確率分布

parameters: α, β

size α

ref. Size (statistics) - Wikipedia

power β

モデル選択

en: model selection

⊂ 理論

もっとも予測能力が高いモデル（= 確率種）を選び取りたい。

⊃ 赤池弘次の理論

例

赤池情報量規準

by. 赤池弘次

abbr. AIC

下に

指標の候補

尤度: ❌

問題

過剰適合、過適合、過学習

未知のデータには無効

AIC

平均尤度（期待値）に着目する。

補正項

モデルの複雑さにペナルティーを与える。

予測重視の極地

説明性がトレード・オフになりがち

cf. XAI

スタイルいろいろ

スタイルの比較

ベイズはパラメーターが変化するので、そのためのモデルがあり、そのためのパラメーター（= ハイパーパラメーター）がある。wint.icon

ref.

https://twitter.com/genkuroki/status/1339613121376256003

@genkuroki: #統計統計学を「頻度論」と「ベイズ」のように主義で分類すること自体が有害な上に、主義の違いによって、定数と確率変数のどちらになるかが決まると考えることが極めて有害。

その代わりになりそうな考え方を書いておきました(試案です)↓

https://pbs.twimg.com/media/EpdDB60VgAASds2.jpg

注意

すべてのモデルは間違っている

推計統計学？の概念

変量

母集団（構造）が持つ関数

sample point → number

確率モデル

措定した存在物

概念

en: level of measurement

水準の低い順（構造の貧相な順）

equalable

+orderable, comparable

+加減算

+乗除算

推論

パラメーター空間からパラメータの部分集合を特定すること。

パラメーター空間

モデルのとり得るパラメーターの集合

統計モデルを決めると定まる。

WAIC/WBIC

実は頻度論らしい。

推定量

統計的仮説

分布族ならパラメーターの仮説に帰着できる。

パラメーターの仮説のデータに対するもっともらしさ。データに対する仮説の尤もらしさ。

データを固定して、パラメーターの関数になる。

cf. 尤度関数

尤度が小さいからって、ただちに確証も反証もしない。モデルに相対的なので、比較しないと言明にならない。

対立仮説も見よ。 #古典統計

大小

説明力の指標になる。

予測能力の指標にはならない。

未来のデータは観測されてないので

population correlation coefficient

ja: 母相関係数

措定された確率モデルのパラメーター。観測されることはない。

最初に任意に設定する確率分布。

この設定の巧拙に職人芸があるとかないとか。wint.icon

ベイズ統計に特有。

関連

基準率錯誤

en: base rate fallacy

無情報事前分布

en: non-informative prior

i.e. 一様分布

e.g. フェアなコイン、フェアなサイコロ

ひとしい確率を割り当てる。

価値

正則化バイアス

過学習ないし過剰適合を回避するための道具

更新された確率分布

現象

洗い流し

en: washing out

sample のサイズ（数。当然回数も）が増えるごとに確率分布が収束していくこと。事前確率のブレを補正できる。

論法

「このベイズ更新を無限に繰り返せるなら…」

余帰納法か？wint.icon

cf. 無限主義

流儀が2つある

Neyman と Pearson の仮説検定 #古典統計

parameter space を 2分割する。片方を帰無仮説として却下する。

仮説の正誤には直接は言及しない。

Fisher 流もある。

有意性検定

対立仮説を立てない、という。

流儀について

Ohkubo, Yusaku. (2019). p 値とは何だったのか (Fisher の有意性検定と Neyman-Pearson の仮説検定を超えるために). 生物科学 70(4), 238-251.

生物学研究においては古典的な統計的検定と p 値が主要な道具として用いられてきたが，アメリカ統計学会が「有意水準が満たされるか否かだけにあらゆる判断を委ねるべきでない」という趣旨の声明を発表し反響を呼んでいる.しかしながら多くの生物学者にとって，p 値に関して何が問題となっているのか理解するのは必ずしも容易ではない.本稿ではまず生態学内部における論争を考察し，「p 値とはそもそも何だったのか」「統計的検定の目的とは何か」までさかのぼって論じることが必要だと指摘する.またこれを踏まえ，Fisher の有意性検定と Neyman-Pearson の仮説検定の相違点や二つの検定が生まれた背景を解説し，目的の異なる統計手法が混同されることの危険性について議論する.

cited as https://twitter.com/kenmcalinn/status/1739858205252165752

標本空間の部分集合$ C⊂Ω

事前にさだめて帰無仮説を対立仮説かを判断するためのサンプルの集合ないし範囲

これで検定関数を定める。

$ ψ: Ω → \{H_0,H_1\}

$ = Ω → 2

検定の誤り

2種

第一種の誤り

aka. false positive

確率$ α

size

(of a test)

ref. Size (statistics) - Wikipedia

def. 上の上限

aka. 有意水準

制御可能

$ 1-α: 信頼率

第二種の誤り

aka. false negative

確率$ β

$ 1−β: 検出力

trade-off の関係にある。

α vs β

同様に 1-α vs 1-β

データ以上に極端な値が出る確率。帰無仮説のありえなさ。

p-value function なる手法があるらしい。

ref. https://twitter.com/genkuroki/status/1567880547648827397

https://nbviewer.org/github/genkuroki/public/blob/main/0036/P-value%20functions%20of%20proportions.ipynb

上記以外のモノ

ref. https://doi.org/10.1080/00031305.2018.1556735

モデル適合

en: model fitting

aka. 学習

結果

適合モデル

いわゆる curve fitting を考える。

ja: 曲線あてはめ

モデルの正当化は考えない。

単なる fitting でしかない。

赤池情報量規準

平均尤度をうまく補正する。

ref. 赤池情報量規準 - Wikipedia

統計的因果推論

手法２つ

反実仮想モデル

構造的因果モデル

因果グラフ

⊂ 有向グラフ

DAG を考えることが多い。

変数集合が2変数の因果を媒介することがある。

open: する場合

block: する上で、相関させなくなってる状態

def. or条件で定義される。省略。

関係をなくした場合

def. 有効分離、d-分離

直接原因

abbr. dc

グラフの直接の上流の変数たちの集合のこと

課題

得られるのか？

→ 因果探索

因果的マルコフ条件

有効分離された変数は独立になる。

$ X \perp_G Y \mid Z \implies X \perp_P Y \mid Z

$ ≡ X\mathrel{⫫}Y \mid Z

因果的に切断される。

構造方程式

忠実性条件

因果的マルコフ条件の逆

$ X \perp_G Y \mid Z \impliedby X\mathrel{⫫}Y \mid Z

仮定の一種

介入

これをグラフで定式化できる。

介入できるなら原因である。

原因でなくする。

可能世界を現実において実現するモノと言える。

余計な変更はしない。

vs. したら fat-hand である。

手法

do計算

介入前の情報だけで介入後の結果を予測できる。

バックドア基準

介入に都合がいい共変量を選ぶ基準

変量

en: variate

多次元版もある。

ja: 多変量

en: multivariate

多変量 vs 多変数

en: multivariate vs multivariable

ref. Multivariate？Multivariable？多変量？多変数？ - ねこすたっと

ref. その統計モデルはMultivaliableなのか，それともMultivariateか? | データ分析おじさんの破れ家

ref. 『新版統計学のセンス』は統計学を「使う」人なら必携の書 - 渋谷駅前で働くデータサイエンティストのブログ

手法

⊂ モデル適合

結果

最尤推定量

aka. 最大尤度

en: maximum likelihood estimator

abbr. MLE

技法

対数尤度

計算を簡単にするため

結果: 最大対数尤度

課題

高次元では解析的に解けない。

数値的に解く必要が出る。

最小二乗法

⊂ モデル適合

⊂ 推測統計

予測に使えるので

回帰モデル

説明変数

目的変数

モデル

parametric

線形…

ベイズ更新

ベイジアンな統計モデルで使う。

反事実的な手法

無作為化比較試験

en: randomized controlled trial

abbr. RCT

因果推論の 1手法

平均処置効果を見るために人工的に独立にする。

自然実験が可能なことがある。

説明変数以外が同じモノをペアと考えられる。これを他の可能世界の代わりに使える。

現実には無理

条件つき独立にできれば十分

def. 強く無視できる割り当て条件

i.e. 交絡因子

i.e. 傾向スコア

反実仮想モデル

en: counterfactual model

#counterfactual

傾向スコアを採用する。

柔軟性や予測性能が上がる。

課題

共変量選択の問題は残る。

ここから哲学

意味論

還元主義をとらない。

可能世界によって理解する。

デイビッド・ルイス流の意味論

構想的因果モデル

因果グラフを使って推論する。

介入

可能世界間の確率分布の写像

最適輸送が応用できるらしい。

do計算

介入の効果を予測できる。

平均処置効果を計算できる。

忠実性条件からグラフ構造を逆に推定できる。

絞り込めても確定できない場合もある。

非忠実（en: unfaithful）な分布でも無理。

問題

周辺化パラドクス

ベイズ統計における問題

Bayes factor がさだまらない。

書籍

入門書（統計学の入門書）

黒木学『数理統計学』

『標準ベイズ統計学』2022、朝倉書店

Peter D. Hoff (2009) A First Course in Bayesian Statistical Methods の日本語訳

#ベイズ統計学

ベイズ統計学｜朝倉書店

https://pdhoff.github.io/book/

ref.

統計学 - Wikipedia

Statistics - Wikipedia

Template:Statistics - Wikipedia

Bayesian statistics - Wikipedia

Statistical inference - Wikipedia

https://en.wikipedia.org/wiki/Statistical_inference#Paradigms_for_inference

Frequentist inference - Wikipedia

Bayesian inference - Wikipedia

Fiducial inference - Wikipedia

ベイズ統計学入門〜頻度主義からベイズ主義へ〜 - Speaker Deck

統計モデル - Wikipedia

Glossary of Statistical Terms / SticiGui / Department of Statistics / UC Berkeley

Bayesian probability - Wikipedia

ベイズ確率 - Wikipedia

Bayesian epistemology - Wikipedia

Statistical hypothesis test - Wikipedia

（（統計的）仮説）検定

第一種の過誤 | 統計用語集 | 統計WEB

第二種の過誤 | 統計用語集 | 統計WEB

P値 | 統計用語集 | 統計WEB