統計学の哲学
統計学の哲学について
あるいはメタ統計学
確率の哲学にも触れる。
統計は科学の正当化にも使われている。
世界観
存在論
データのみ
一元論
→ 実証主義
データ vs 確率モデル
二元論
データ、確率、因果
三元論
意味論
数学的な存在と現実の存在との対応づけ
abstract → concrete
認識論
確率モデルなどを推計・推論する。
分野が成熟すると、意味論をスキップしても研究できる。
科学の認識論にも関わる。
態度
まず存在論を決める必要がある。
cf. 3層構造
つぎに認識論を決める必要がある。
難度のトレード・オフ
そして手法を選ぶ。
理論も
概念
確率種
独自用語
en: prob kind?
確率モデル、特に統計モデルのこと
⊂ natural kind
自然種の確率版
つまり実在論
世界の切り出しかた(クラス化)は人により違う。
物理的な構造には supervene しない。
因果種
en: causal kind
独自用語
因果モデルのこと
⊂ 自然種
モデル
#model
確率モデルの意味論を考える。
モデルとして確率を定式化したので、その意味論が問題になる。
確率モデル
斉一性くらいしかコミットしない。
実世界の真なる描像と言える。
しかし実態は わからない。
統計モデル
より強い仮定を措いた確率モデル。分布やパラメーターなどを仮定している。
現実的なコストで特定できる様にする。
実世界の modeling に使える。
存在の階層は二元論か wint.icon
推定
存在論の浅い階層から深い階層の存在を特定する試み
e.g. データ → 確率分布 → 因果構造
それでも究極的には措定物であり仮説である。
存在論
モデルの斉一性を仮定する。 #推定
道具主義的な側面がある。
科学の存在論にも関わる。
確率種という存在への2つの見かた・態度
確率モデル
real pattern
cf. pragmatism
態度は認識能力に応じて変わり得る。
意味論
認識論によって違ってくる。
対立
ベイズ
Bayesian epistemology? wint.icon
ブール代数を確率モデルとする
標本は原子命題
いわゆる主観説
e.g. 主観確率
古典
#客観確率
後述 統計学の哲学#6561576b5dcf9100002e5887
認識論
分野(二項対立)
内在主義的認識論
en: internalism
内的な信念からの連鎖
ベイズ主義「データがすべて」
尤度主義
つまり尤度原理を採用してるはずwint.icon
外在主義的認識論
en: externalism
手続き的な客観性に依拠する
頻度主義「データがすべてではない。プロセスも加味する。」
非尤度主義
統計は科学的な知識の正当化を担っている。
ベイズ主義と内在主義の相性が良い。
無限回の推論による洗い流しを正当化として許容する立場もある。 cf. 無限主義
vs. 実際は無限でなく有限である。
さしづめ“遡行”主義
どちらの方法論を とるにせよ、体系の外界である世界との関係を無視しては無意味になる。
プラグマティズム認識論
e.g.
モデル選択
深層学習
実際、統計モデルも応用において有用性を目的としたモノが多い。
≒ 認知プロセス
cf. テクネー
cf. ジョージ・ボックス
徳認識論
認識における美徳(⊂性質)で評価する。
e.g. 認識能力など
認識論的基礎づけ主義
#基礎付け主義 #認識論
特にベイズ統計に おいて
ベイズ的な認識論にも2つの立場がある。
アプリオリズム
e.g. 無差別の原理
by ラプラス?wint.icon
個人の恣意性がない。
間主観的に一致する。これのみ
vs. 間違いに一致してしまう かも知れない。
真理促進性もない。
疑義
パラドクスが知られてる。割愛。
e.g. 尤度が正しいこと
客観性がある。
アポステリオリズム
e.g. 経験ベイズ
経験データを事前分布におく。
cf. 主要原理
疑義
起こりやすさの定義
その基準となる参照クラスの決めかたには、恣意性が残る。
そもそも なぜ経験的な頻度 ないし その信念で 事前分布を基礎づけて良いのか。
基礎づけそのもの問題
仮説演繹法
反証は難しい
cf. デュエム–クワイン・テーゼ (en: Duhem–Quine thesis)、決定不全
結局、試行錯誤するしかない
cf. ノイラートの船
尤度原理
仮説ないしモデルに対する推論(パラメーターなど)に必要なモノは すべて尤度から得られる、とする主張
採用・不採用
採用: ベイズ主義者、尤度主義者
不採用: 頻度主義
尤度が高くても棄却することがある。
逆に単一の事象を見ると帰無仮説の方が尤度が高いこともある。
ベイズ主義
主張: ベイズ統計は帰納論理である。
ベイズ推論は真理関数に確率関数を採用した推論である、という。
演繹論理の一種だという。
疑義: 帰納推論は真理保存的でないので演繹論理では有り得ないのでは?
帰納なら情報を創造するはずだ。
ポパーによる批判「心理主義だ。」
思ひなし
応答ふたつ(下記)
特徴
得られるのは真偽ではなくて信念の度合い。
結局、ベイズ主義の信念の対象は、標本空間の範囲まで
せいぜい所与までしか認めない。
model check
2 ways
事前にチェック
事後にチェック
cf. 仮説演繹法に似てる。
チェックは ベイズ推論の外(前・後)で やる。
事後にも検証する。
つまり内在主義的認識論では収まらない。
→ 全体論
統計的分析
信念のネットワークの改訂だと みなす
古典統計
相対頻度を基礎とする。
頻度は客観的である。
#客観確率
en: empirical probability
検定を基礎に置く。
#検定理論
信念を形成する過程を正当化する。
モデルそのものは見ない。
2部分
サイズ α
検出力 1 − β
↑ノージックの反事実条件に対応する。
仮説は可能世界の描写である。
検定は可能世界の半分を却下するので counterfactual である。
cf. 不可能世界?wint.icon
帰納推論への認識論は、仮説は棄却するモノだ、という。
cf. ポパーの反証主義
テストを生き延びても、確証されたことには ならない。
i.e. 後件肯定の誤謬
つまり外在主義的認識論
課題
相対頻度が定まらない
無限の試行の系列(en: collective)による確率の収束先だとする。
実際は無限は不可能。
問題を randomness に押し付けることは できる。
説明になって なくない?wint.icon
蓋然的な推論は反証できない。
つまり帰納的推論は演繹的に反証することは できない。
i.e. 反証主義の限界
特徴
単一のイベントの確率は未定義
e.g. 歴史上のイベント、特定の試行
あくまでも集まり・系列にのみ定義される。
type のみ。 token でない。 #カテゴリー錯誤
「仮説の確率」はナンセンス
世界の客観的な事実は 仮説とは独立に決まってるため。
世界を試行することは できないため。
帰納らしさ
帰納行動 by Neyman
習慣 by David Hume
応用例
大量生産
科学研究
正当化
信頼性主義
正当化プロセスの客観的な信頼性に依る
⊂ 外在主義(的認識論)
cf. Gettier problem
内在主義への反例 or 知識概念への反例
e.g. Robert Nozickの追跡理論
tracking theory (of knowledge), truth tracking theory
→ 信頼主義的正当化
信頼できる認識過程は 2つの反事実条件から定義される。
cf. 反実仮想
客観的な一致でもって信念を正当化するので、定義からして真理促進性がある。 by def
counterfactual について
aka. 反事実条件法、反事実的条件文、反実仮想
可能世界意味論を使う。
(近傍の関係ある)可能世界の割合(これが確率)で判断する。
可能世界は確率種までが共通していて、そのパラメーターだけが違う範囲をとる。
ここが因果推論だと言える?wint.icon
特に古典統計に関わる問題と批判
再現性の危機
cf. QRPs
p値問題
多重検定
e.g. p-hacking
停止規則問題
⊂ 一般性問題
尤度原理に反する例
例えば実験デザインに依存する。
勘違い
検定理論は検定の正当性については言えるが、前提条件であるモデルの妥当性は言えない。
前提条件や外部条件は、別途 評価されるべき。
結局、理論に閉じないのはベイズと同じだな。wint.icon
モデル選択
en: model selection
赤池情報量規準のパラドクス
精度が上がれば良いってモノではない。
i.e. 汎化性能
予測性能のパラドックス
自然種では普通である。単純化や理想化は常にやってる。
そもそも線引き(離散化)の時点で捨象してる。
帰納推論には捨象(タイプ化)は不可避である。
予測性能を重視する。
いわゆる統計屋が説明能力を重視するのとは違う。
存在への態度が違う。
確率モデルでなく、real pattern の方を真なる存在だと考える。
将来にわたる予測において robustness がある。
深層学習
en: deep learning
予測に特化してる。
予測性能しか見ないとまで言えそう。wint.icon
e.g. neural network
⊂ 確率種
認識論
プラグマティズム認識論
有用性>真偽・真理
vs. 自然の鏡
課題
知識として正当化できる?
opt. 信頼性主義
個別の正当化以上のコトはできる?
正当化
徳認識論で正当化できる。
個体の性質に帰着させる。
しかし、かつての本質主義の世界観に逆行していってないか?
哲学的含意
説明が求められる。
自然種による演繹的なアプローチではムリ。
いかに理解するか
XAI
深層モデルを説明できるか。
モデル自身が自分を説明できるか。
反省的知識を問題にしてる。
予測能力と説明能力のトレード・オフがあるらしい。
e.g. 表現学習、転移学習
翻訳の不確実性 by Quine
根底的翻訳の問題
accountability(説明可能性)の問題
要は責任問題になる。wint.icon
存在論を示唆する現象
転移学習
敵対的事例
因果推論
特に統計的因果推論
古典: ヒュームによる因果の定義
疑似因果の問題
e.g. M字構造をモデルに入れては いけない。
間接的な影響の問題
cf. Simpson's paradox
分からない要因
規則説の限界
i.e. 認識論の問題
因果は確率(= 確率種)ではない。
対案: 反事実条件説
真理値の定義: 可能世界意味論
適当に近い可能世界
適例世界
反例世界
認識論?
❌検定ではない。
仮説検定と因果推論の類似性
対立仮説の成立と帰無仮説の棄却との間に因果関係が成立するか
検定はある因果に依拠してる。
i.e. 証明には ならない。
RCT
可能世界の情報を見る方法は ないのか?
補完してエミュれる。
問題
因果推論の根本問題
反事実的なので経験的に示せない。
潜在結果は常に片方だけ。
対策: 平均処置効果
普通は わからない
じゃあ独立にしてやれば良い
→ 無作為化比較試験
自然の斉一性では無理。
つまりそのモデルである確率モデルでも無理。
因果グラフ
因果構造という存在を導入する。
課題:獲得・推論できるのか?
データから推論・推定する認識論が必要
→ 因果探索
Bayesian netowork ではない。
確率分布の世界の住人
これは因果モデルの世界の住人
哲学的含意
統一できるのでは?
→ 被覆法則モデル(en: covering law model)
還元主義的なアプローチなので失敗した。
存在論が三元論になる。
データとモデルの二元論では無理。
因果モデル・確率分布・データの三元論
因果→分布→データ
3層構造
介入:写像(現実世界→可能世界)
因果モデル:分布×介入→分布
do計算:その計算
似た抽象化でも世界がちがうことに注意せよ。
議論
論理とは?
古典的な形式演繹論理では、推論は真理関数の方程式を解く論証によってなされる。
ここで真理関数の真理値は2値である。
多値にすると確率関数となりベイズ推論になる、という。
cf. 多値論理
論証の妥当性と健全性は同等である。
蓋然的な根拠づけにベイズ推論が使えるか
帰納的強度として根拠関係を定量化できそう。wint.icon
cf. lottery paradox
ja: 富くじのパラドックス
真理とは
真理保存的でなくとも、真理促進的(en: truth-conducive)であれば十分では?有用では?
認識論の正当化
上述
尤度の正当化
尤度は、統計モデルを決めるごとに決まる。
モデルの選択の根拠は?
有限試行ではムリ
方策
model check
一般性問題
信頼性主義の問題
信頼できる(検定)プロセスの信頼性の基準が定まらない。正しい(認識)プロセスが一意に定まらない。
cf. 参照クラスの問題
正確に説明するモデルだからって、予測性能は高いのか?
→ いいえ
存在とは
2つの立場
より確率モデルに近い方
典型的な統計家
説明能力を重視
より予測性能が高い方
e.g. AIC
確率モデルの措定は実在論か?
ref. 「真の分布」の仮定は実在論的か? - Speaker Deck
要点
(形式)理論(および手法)と主義は独立である。
反論
形式的な(抽象的な)対象物を措定するして表現のは、実在(= 具体的な存在)である対応物の存在にコミットしたことには ならない。
(形式的)理論と実在論は別、とのこと
真の分布(= 確率モデル)は理論的な対象であって、現実に対応する具体物は存在しない。
有用性からして、実在(i.e. 確率種)である、という実在論は言える。wint.icon
形式的な世界と現実世界の区別は良く出てくる……というか、モデル化や形式化の基本的な世界観だろうwint.icon
他の立場・主義
尤度主義
尤度のみでモデルの優劣を決める立場
つまり事前分布を認めるとは限らない。
客観的なら みとめる。
主観的なら みとめない。
尤度原理を満たす。
等価
十分性の原理
条件づけの原理
反事実的な実現は無関係で無視する。
頻度主義者はこれに反対する。
統計の分野
記述統計学
存在論としてはデータのみ
要約できる。
推測統計学
存在論には確率モデルが必要
その斉一性を措定する。
世界の話
帰納推論できる。
因果推論
存在論においては、さらに因果モデルが必要
可能世界(群)の話
介入の予測・評価ができる。
分野
Bayesian epistemology
ja: ベイズ認識論
ref.
Bayesian epistemology - Wikipedia
Bayesian Epistemology (Stanford Encyclopedia of Philosophy)
Bayesian Epistemology (Stanford Encyclopedia of Philosophy/Winter 2021 Edition)
aka. ベイズ主義? Baysianism? wint.icon
vs. 頻度主義認識論?wint.icon
測定理論
有意味性の条件を探る
e.g. 尺度
論者
エリオット・ソーバー
3分法
ベイズ主義
唯一、仮説の確率を認める。
尤度主義
単純仮説は扱えるが複合仮説は扱えない。
AIC が助けになる。
頻度主義
AIC は頻度論に分類できる という
ref. ベイズ主義、尤度主義、頻度主義の関係性 - 講義のページへようこそ
ベイズ主義と尤度主義とを分けてることが特徴的かwint.icon
書籍
大塚 淳『統計学を哲学する』
統計学を哲学する « 名古屋大学出版会
感想
https://x.com/wint7/status/1736690431352787124
review
統計学の認識論:ベイズ主義と頻度主義 - 講義のページへようこそ
エリオット・ソーバー『科学と証拠: 統計の哲学 入門』
ref.
Philosophy of Statistics (Stanford Encyclopedia of Philosophy)
Interpretations of Probability (Stanford Encyclopedia of Philosophy)