統計学の哲学

統計学の哲学について

あるいはメタ統計学

確率の哲学にも触れる。

統計は科学の正当化にも使われている。

統計とは

wint.icon暫定: 数理認識論

cf.

統計学とは哲学的概念を数学を使ってモデル化したもの

ref. なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録

Fisherはざっくり統計学のコアは帰納推論だと言った。すくなくともかなり説明したと言った。

as cited in...

田邉は確実に統計は帰納だと言ってる。

世界観

存在論

データのみ

一元論

→ 実証主義

データ vs 確率モデル

二元論

データ、確率、因果モデル

三元論

意味論

数学的な存在と現実の存在との対応づけ

abstract → concrete

認識論

確率モデルなどを推計・推論する。

分野が成熟すると、意味論をスキップしても研究できる。

科学の認識論にも関わる。

態度

まず存在論を決める必要がある。

cf. 3層構造

つぎに認識論を決める必要がある。

難度のトレード・オフ

そして手法を選ぶ。

理論も

概念

確率種

独自用語

en: prob kind？

確率モデル、特に統計モデルのこと

⊂ natural kind

自然種の確率版

つまり実在論

世界の切り出しかた（クラス化）は人により違う。

物理的な構造には supervene しない。

因果種

en: causal kind

独自用語

因果モデルのこと

⊂ 自然種

モデル

#model

確率モデルの意味論を考える。

モデルとして確率を定式化したので、その意味論が問題になる。

確率モデル

斉一性くらいしかコミットしない。

実世界の真なる描像と言える。

しかし実態はわからない。

統計モデル

より強い仮定を措いた確率モデル。分布やパラメーターなどを仮定している。

現実的なコストで特定できる様にする。

実世界の modeling に使える。

存在の階層は二元論か wint.icon

推定

存在論の浅い階層から深い階層の存在を特定する試み

e.g. データ → 確率分布 → 因果構造

それでも究極的には措定物であり仮説である。

存在論

モデルの斉一性を仮定する。 #推定

道具主義的な側面がある。

科学の存在論にも関わる。

確率種という存在への2つの見かた・態度

確率モデル

real pattern

cf. pragmatism

態度は認識能力に応じて変わり得る。

意味論

認識論によって違ってくる。

対立

ベイズ

Bayesian epistemology? wint.icon

ブール代数を確率モデルとする

標本は原子命題

いわゆる主観説

e.g. 主観確率

古典

#客観確率

後述統計学の哲学#6561576b5dcf9100002e5887

認識論

分野（二項対立）

内在主義的認識論

en: internalism

内的な信念からの連鎖

ベイズ主義「データがすべて」

尤度主義

つまり尤度原理を採用してるはずwint.icon

外在主義的認識論

en: externalism

手続き的な客観性に依拠する

頻度主義「データがすべてではない。プロセスも加味する。」

非尤度主義

統計は科学的な知識の正当化を担っている。

ベイズ主義と内在主義の相性が良い。

無限回の推論による洗い流しを正当化として許容する立場もある。 cf. 無限主義

vs. 実際は無限でなく有限である。

さしづめ“遡行”主義

どちらの方法論をとるにせよ、体系の外界である世界との関係を無視しては無意味になる。

プラグマティズム認識論

e.g.

モデル選択

深層学習

実際、統計モデルも応用において有用性を目的としたモノが多い。

≒ 認知プロセス

cf. テクネー

cf. ジョージ・ボックス

徳認識論

認識における美徳（⊂性質）で評価する。

e.g. 認識能力など

認識論的基礎づけ主義

#基礎付け主義 #認識論

特にベイズ統計において

ベイズ的な認識論にも2つの立場がある。

アプリオリズム

e.g. 無差別の原理

by ラプラス？wint.icon

個人の恣意性がない。

間主観的に一致する。これのみ

vs. 間違いに一致してしまうかも知れない。

真理促進性もない。

疑義

パラドクスが知られてる。割愛。

e.g. 尤度が正しいこと

客観性がある。

アポステリオリズム

e.g. 経験ベイズ

経験データを事前分布におく。

cf. 主要原理

疑義

起こりやすさの定義

その基準となる参照クラスの決めかたには、恣意性が残る。

そもそもなぜ経験的な頻度ないしその信念で事前分布を基礎づけて良いのか。

基礎づけそのものの問題

仮説演繹法

反証は難しい

cf. デュエム–クワイン・テーゼ (en: Duhem–Quine thesis)、決定不全

結局、試行錯誤するしかない

cf. ノイラートの船

尤度原理

仮説ないしモデルに対する推論（パラメーターなど）に必要なモノはすべて尤度から得られる、とする主張

採用・不採用

採用: ベイズ主義者、尤度主義者

不採用: 頻度主義

尤度が高くても棄却することがある。

逆に単一の事象を見ると帰無仮説の方が尤度が高いこともある。

ベイズ主義

主張: ベイズ統計は帰納論理である。

ベイズ推論は真理関数に確率関数を採用した推論である、という。

演繹論理の一種だという。

疑義: 帰納推論は真理保存的でないので演繹論理では有り得ないのでは？

帰納なら情報を創造するはずだ。

ポパーによる批判「心理主義だ。」

思ひなし

応答ふたつ（下記）

特徴

得られるのは真偽ではなくて信念の度合い。

結局、ベイズ主義の信念の対象は、標本空間の範囲まで

せいぜい所与までしか認めない。

model check

2 ways

事前にチェック

事後にチェック

cf. 仮説演繹法に似てる。

チェックはベイズ推論の外（前・後）でやる。

事後にも検証する。

つまり内在主義的認識論では収まらない。

→ 全体論

統計的分析

信念のネットワークの改訂だとみなす

古典統計

相対頻度を基礎とする。

頻度は客観的である。

#客観確率

en: empirical probability

検定を基礎に置く。

#検定理論

信念を形成する過程を正当化する。

モデルそのものは見ない。

2部分

サイズ α

検出力 1 − β

↑ノージックの反事実条件に対応する。

仮説は可能世界の描写である。

検定は可能世界の半分を却下するので counterfactual である。

cf. 不可能世界？wint.icon

帰納推論への認識論は、仮説は棄却するモノだ、という。

cf. ポパーの反証主義

テストを生き延びても、確証されたことにはならない。

i.e. 後件肯定の誤謬

つまり外在主義的認識論

課題

相対頻度が定まらない

無限の試行の系列（en: collective）による確率の収束先だとする。

実際は無限は不可能。

問題を randomness に押し付けることはできる。

説明になってなくない？wint.icon

蓋然的な推論は反証できない。

つまり帰納的推論は演繹的に反証することはできない。

i.e. 反証主義の限界

特徴

単一のイベントの確率は未定義

e.g. 歴史上のイベント、特定の試行

あくまでも集まり・系列にのみ定義される。

type のみ。 token でない。 #カテゴリー錯誤

「仮説の確率」はナンセンス

世界の客観的な事実は仮説とは独立に決まってるため。

世界を試行することはできないため。

帰納らしさ

帰納行動 by Neyman

習慣 by David Hume

応用例

大量生産

科学研究

正当化

信頼性主義

正当化プロセスの客観的な信頼性に依る

⊂ 外在主義（的認識論）

cf. Gettier problem

内在主義への反例 or 知識概念への反例

e.g. Robert Nozickの追跡理論

tracking theory (of knowledge), truth tracking theory

→ 信頼主義的正当化

信頼できる認識過程は 2つの反事実条件から定義される。

cf. 反実仮想

客観的な一致でもって信念を正当化するので、定義からして真理促進性がある。 by def

counterfactual について

aka. 反事実条件法、反事実的条件文、反実仮想

可能世界意味論を使う。

（近傍の関係ある）可能世界の割合（これが確率）で判断する。

可能世界は確率種までが共通していて、そのパラメーターだけが違う範囲をとる。

ここが因果推論だと言える？wint.icon

特に古典統計に関わる問題と批判

再現性の危機

cf. QRPs

p値問題

多重検定

e.g. p-hacking

停止規則問題

⊂ 一般性問題

尤度原理に反する例

例えば実験デザインに依存する。

勘違い

検定理論は検定の正当性については言えるが、前提条件であるモデルの妥当性は言えない。

前提条件や外部条件は、別途評価されるべき。

結局、理論に閉じないのはベイズと同じだな。wint.icon

モデル選択

en: model selection

赤池情報量規準のパラドクス

精度が上がれば良いってモノではない。

i.e. 汎化性能

予測性能のパラドックス

自然種では普通である。単純化や理想化は常にやってる。

そもそも線引き（離散化）の時点で捨象してる。

帰納推論には捨象（タイプ化）は不可避である。

予測性能を重視する。

いわゆる統計屋が説明能力を重視するのとは違う。

存在への態度が違う。

確率モデルでなく、real pattern の方を真なる存在だと考える。

将来にわたる予測において robustness がある。

深層学習

en: deep learning

予測に特化してる。

予測性能しか見ないとまで言えそう。wint.icon

e.g. neural network

⊂ 確率種

認識論

プラグマティズム認識論

有用性＞真偽・真理

vs. 自然の鏡

課題

知識として正当化できる？

opt. 信頼性主義

個別の正当化以上のコトはできる？

正当化

徳認識論で正当化できる。

個体の性質に帰着させる。

しかし、かつての本質主義の世界観に逆行していってないか？

哲学的含意

説明が求められる。

自然種による演繹的なアプローチではムリ。

いかに理解するか

XAI

深層モデルを説明できるか。

モデル自身が自分を説明できるか。

反省的知識を問題にしてる。

予測能力と説明能力のトレード・オフがあるらしい。

e.g. 表現学習、転移学習

翻訳の不確実性 by Quine

根底的翻訳の問題

accountability（説明可能性）の問題

要は責任問題になる。wint.icon

存在論を示唆する現象

転移学習

敵対的事例

因果推論

特に統計的因果推論

古典: ヒュームによる因果の定義

疑似因果の問題

aka. 疑似相関

e.g. M字構造をモデルに入れてはいけない。

間接的な影響の問題

cf. Simpson's paradox

分からない要因

規則説の限界

i.e. 認識論の問題

因果は確率（= 確率種）ではない。

対案: 反事実条件説

真理値の定義: 可能世界意味論

適当に近い可能世界

適例世界

反例世界

認識論？

❌検定ではない。

仮説検定と因果推論の類似性

対立仮説の成立と帰無仮説の棄却との間に因果関係が成立するか

検定はある因果に依拠してる。

i.e. 証明にはならない。

RCT

可能世界の情報を見る方法はないのか？

補完してエミュれる。

問題

因果推論の根本問題

反事実的なので経験的に示せない。

潜在結果は常に片方だけ。

対策: 平均処置効果

普通はわからない

じゃあ独立にしてやれば良い

→ 無作為化比較試験

自然の斉一性では無理。

つまりそのモデルである確率モデルでも無理。

因果グラフ

因果構造という存在を導入する。

課題：獲得・推論できるのか？

データから推論・推定する認識論が必要

→ 因果探索

Bayesian netowork ではない。

確率分布の世界の住人

これは因果モデルの世界の住人

哲学的含意

統一できるのでは？

→ 被覆法則モデル（en: covering law model）

還元主義的なアプローチなので失敗した。

存在論が三元論になる。

データとモデルの二元論では無理。

因果モデル・確率分布・データの三元論

因果→分布→データ

3層構造

介入：写像（現実世界→可能世界）

因果モデル：分布×介入→分布

do計算：その計算

似た抽象化でも世界がちがうことに注意せよ。

議論

論理とは？

古典的な形式演繹論理では、推論は真理関数の方程式を解く論証によってなされる。

ここで真理関数の真理値は2値である。

多値にすると確率関数となりベイズ推論になる、という。

cf. 多値論理

論証の妥当性と健全性は同等である。

蓋然的な根拠づけにベイズ推論が使えるか

帰納的強度として根拠関係を定量化できそう。wint.icon

cf. lottery paradox

ja: 富くじのパラドックス

真理とは

真理保存的でなくとも、真理促進的（en: truth-conducive）であれば十分では？有用では？

認識論の正当化

上述

尤度の正当化

尤度は、統計モデルを決めるごとに決まる。

モデルの選択の根拠は？

有限試行ではムリ

方策

model check

一般性問題

信頼性主義の問題

信頼できる（検定）プロセスの信頼性の基準が定まらない。正しい（認識）プロセスが一意に定まらない。

cf. 参照クラスの問題

正確に説明するモデルだからって、予測性能は高いのか？

→ いいえ

存在とは

2つの立場

より確率モデルに近い方

典型的な統計家

説明能力を重視

より予測性能が高い方

e.g. AIC

確率モデルの措定は実在論か？

ref. 「真の分布」の仮定は実在論的か？ - Speaker Deck

要点

（形式）理論（および手法）と主義は独立である。

反論

形式的な（抽象的な）対象物を措定するして表現のは、実在（= 具体的な存在）である対応物の存在にコミットしたことにはならない。

（形式的）理論と実在論は別、とのこと

真の分布（= 確率モデル）は理論的な対象であって、現実に対応する具体物は存在しない。

有用性からして、実在（i.e. 確率種）である、という実在論は言える。wint.icon

形式的な世界と現実世界の区別は良く出てくる……というか、モデル化や形式化の基本的な世界観だろうwint.icon

他の立場・主義

尤度主義

尤度のみでモデルの優劣を決める立場

つまり事前分布を認めるとは限らない。

客観的ならみとめる。

主観的ならみとめない。

尤度原理を満たす。

等価

十分性の原理

条件づけの原理

反事実的な実現は無関係で無視する。

頻度主義者はこれに反対する。

統計の分野

記述統計学

存在論としてはデータのみ

要約できる。

推測統計学

存在論には確率モデルが必要

その斉一性を措定する。

世界の話

帰納推論できる。

因果推論

存在論においては、さらに因果モデルが必要

可能世界（群）の話

介入の予測・評価ができる。

分野

Bayesian epistemology

ja: ベイズ認識論

ref.

Bayesian epistemology - Wikipedia

Bayesian Epistemology (Stanford Encyclopedia of Philosophy)

Bayesian Epistemology (Stanford Encyclopedia of Philosophy/Winter 2021 Edition)

aka. ベイズ主義？ Baysianism? wint.icon

vs. 頻度主義認識論？wint.icon

測定理論

有意味性の条件を探る

e.g. 尺度

論者

エリオット・ソーバー

3分法

ベイズ主義

唯一、仮説の確率を認める。

尤度主義

単純仮説は扱えるが複合仮説は扱えない。

AIC が助けになる。

頻度主義

AIC は頻度論に分類できるという

ref. ベイズ主義、尤度主義、頻度主義の関係性 - 講義のページへようこそ

ベイズ主義と尤度主義とを分けてることが特徴的かwint.icon

書籍

大塚淳『統計学を哲学する』

統計学を哲学する « 名古屋大学出版会

感想

https://x.com/wint7/status/1736690431352787124

review

統計学の認識論：ベイズ主義と頻度主義 - 講義のページへようこそ

エリオット・ソーバー『科学と証拠: 統計の哲学入門』

ref.

Philosophy of Statistics (Stanford Encyclopedia of Philosophy)

Interpretations of Probability (Stanford Encyclopedia of Philosophy)

なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録

統計学とは哲学的概念を数学を使ってモデル化したものと捉えた方がよいのだ。

統計学とは何か、そしてベイズ統計学の話 - hidekatsu-izuno 日々の記録

因果推論とは何なのか - hidekatsu-izuno 日々の記録

#統計学 #哲学