統計学の哲学
あるいはメタ統計学
確率の哲学にも触れる。
統計は科学の正当化にも使われている。
世界観
データのみ
データ vs 確率モデル
データ、確率、因果
数学的な存在と現実の存在との対応づけ
abstract → concrete
分野が成熟すると、意味論をスキップしても研究できる。
科学の認識論にも関わる。
態度
まず存在論を決める必要がある。
cf. 3層構造
つぎに認識論を決める必要がある。
難度のトレード・オフ
そして手法を選ぶ。
理論も
概念
独自用語
en: prob kind?
確率モデル、特に統計モデルのこと
⊂ natural kind
因果種
en: causal kind
独自用語
因果モデルのこと
⊂ 自然種
モデル
モデルとして確率を定式化したので、その意味論が問題になる。
斉一性くらいしかコミットしない。
実世界の真なる描像と言える。
しかし実態は わからない。
より強い仮定を措いた確率モデル。分布やパラメーターなどを仮定している。
現実的なコストで特定できる様にする。
実世界の modeling に使える。
存在の階層は二元論か wint.icon
推定
存在論の浅い階層から深い階層の存在を特定する試み
e.g. データ → 確率分布 → 因果構造
それでも究極的には措定物であり仮説である。
科学の存在論にも関わる。
確率種という存在への2つの見かた・態度
態度は認識能力に応じて変わり得る。
認識論によって違ってくる。
対立
Bayesian epistemology? wint.icon
ブール代数を確率モデルとする
標本は原子命題
いわゆる主観説
古典
分野(二項対立)
内的な信念からの連鎖
ベイズ主義「データがすべて」
尤度主義
つまり尤度原理を採用してるはずwint.icon
手続き的な客観性に依拠する
頻度主義「データがすべてではない。プロセスも加味する。」
非尤度主義
統計は科学的な知識の正当化を担っている。
ベイズ主義と内在主義の相性が良い。
無限回の推論による洗い流しを正当化として許容する立場もある。 cf. 無限主義 vs. 実際は無限でなく有限である。
さしづめ“遡行”主義
どちらの方法論を とるにせよ、体系の外界である世界との関係を無視しては無意味になる。
e.g.
モデル選択
深層学習
実際、統計モデルも応用において有用性を目的としたモノが多い。
≒ 認知プロセス
cf. テクネー
cf. ジョージ・ボックス
認識における美徳(⊂性質)で評価する。
e.g. 認識能力など
認識論的基礎づけ主義
特にベイズ統計に おいて
ベイズ的な認識論にも2つの立場がある。
個人の恣意性がない。
間主観的に一致する。これのみ
vs. 間違いに一致してしまう かも知れない。
真理促進性もない。
疑義
パラドクスが知られてる。割愛。
客観性がある。
疑義
起こりやすさの定義
その基準となる参照クラスの決めかたには、恣意性が残る。 そもそも なぜ経験的な頻度 ないし その信念で 事前分布を基礎づけて良いのか。
結局、試行錯誤するしかない
仮説ないしモデルに対する推論(パラメーターなど)に必要なモノは すべて尤度から得られる、とする主張 採用・不採用
採用: ベイズ主義者、尤度主義者
不採用: 頻度主義
尤度が高くても棄却することがある。
逆に単一の事象を見ると帰無仮説の方が尤度が高いこともある。
疑義: 帰納推論は真理保存的でないので演繹論理では有り得ないのでは? 帰納なら情報を創造するはずだ。
思ひなし
応答ふたつ(下記)
特徴
得られるのは真偽ではなくて信念の度合い。
結局、ベイズ主義の信念の対象は、標本空間の範囲まで
せいぜい所与までしか認めない。
model check
2 ways
事前にチェック
事後にチェック
チェックは ベイズ推論の外(前・後)で やる。
事後にも検証する。
信念のネットワークの改訂だと みなす
検定を基礎に置く。
信念を形成する過程を正当化する。
モデルそのものは見ない。
2部分
サイズ α
↑ノージックの反事実条件に対応する。
仮説は可能世界の描写である。
検定は可能世界の半分を却下するので counterfactual である。
帰納推論への認識論は、仮説は棄却するモノだ、という。
テストを生き延びても、確証されたことには ならない。
課題
相対頻度が定まらない
無限の試行の系列(en: collective)による確率の収束先だとする。
実際は無限は不可能。
説明になって なくない?wint.icon
蓋然的な推論は反証できない。
特徴
単一のイベントの確率は未定義
e.g. 歴史上のイベント、特定の試行
あくまでも集まり・系列にのみ定義される。
「仮説の確率」はナンセンス
世界の客観的な事実は 仮説とは独立に決まってるため。
世界を試行することは できないため。
帰納らしさ
応用例
大量生産
科学研究
正当化
信頼性主義
正当化プロセスの客観的な信頼性に依る
cf. Gettier problem
内在主義への反例 or 知識概念への反例
→ 信頼主義的正当化
信頼できる認識過程は 2つの反事実条件から定義される。
客観的な一致でもって信念を正当化するので、定義からして真理促進性がある。 by def
(近傍の関係ある)可能世界の割合(これが確率)で判断する。 可能世界は確率種までが共通していて、そのパラメーターだけが違う範囲をとる。
ここが因果推論だと言える?wint.icon
特に古典統計に関わる問題と批判
p値問題
多重検定
e.g. p-hacking
停止規則問題
例えば実験デザインに依存する。
勘違い
検定理論は検定の正当性については言えるが、前提条件であるモデルの妥当性は言えない。
前提条件や外部条件は、別途 評価されるべき。
結局、理論に閉じないのはベイズと同じだな。wint.icon
精度が上がれば良いってモノではない。
予測性能のパラドックス
自然種では普通である。単純化や理想化は常にやってる。 そもそも線引き(離散化)の時点で捨象してる。
予測性能を重視する。
いわゆる統計屋が説明能力を重視するのとは違う。
存在への態度が違う。
将来にわたる予測において robustness がある。
予測に特化してる。
予測性能しか見ないとまで言えそう。wint.icon
⊂ 確率種
認識論
有用性>真偽・真理
課題
知識として正当化できる?
opt. 信頼性主義
個別の正当化以上のコトはできる?
正当化
個体の性質に帰着させる。
しかし、かつての本質主義の世界観に逆行していってないか? 哲学的含意
説明が求められる。
自然種による演繹的なアプローチではムリ。
いかに理解するか
深層モデルを説明できるか。
モデル自身が自分を説明できるか。
予測能力と説明能力のトレード・オフがあるらしい。
根底的翻訳の問題
存在論を示唆する現象
転移学習
敵対的事例
e.g. M字構造をモデルに入れては いけない。
間接的な影響の問題
分からない要因
規則説の限界
i.e. 認識論の問題
因果は確率(= 確率種)ではない。
対案: 反事実条件説
適当に近い可能世界
適例世界
反例世界
認識論?
❌検定ではない。
仮説検定と因果推論の類似性
対立仮説の成立と帰無仮説の棄却との間に因果関係が成立するか
検定はある因果に依拠してる。
i.e. 証明には ならない。
可能世界の情報を見る方法は ないのか?
補完してエミュれる。
問題
因果推論の根本問題
反事実的なので経験的に示せない。
普通は わからない
じゃあ独立にしてやれば良い
自然の斉一性では無理。
つまりそのモデルである確率モデルでも無理。
因果構造という存在を導入する。
課題:獲得・推論できるのか?
データから推論・推定する認識論が必要
Bayesian netowork ではない。
確率分布の世界の住人
これは因果モデルの世界の住人
哲学的含意
統一できるのでは?
存在論が三元論になる。
データとモデルの二元論では無理。
因果モデル・確率分布・データの三元論
因果→分布→データ
3層構造
介入:写像(現実世界→可能世界)
因果モデル:分布×介入→分布
do計算:その計算
似た抽象化でも世界がちがうことに注意せよ。
議論
論理とは?
古典的な形式演繹論理では、推論は真理関数の方程式を解く論証によってなされる。 ここで真理関数の真理値は2値である。
多値にすると確率関数となりベイズ推論になる、という。
蓋然的な根拠づけにベイズ推論が使えるか
ja: 富くじのパラドックス
真理とは
認識論の正当化
上述
尤度は、統計モデルを決めるごとに決まる。
モデルの選択の根拠は?
有限試行ではムリ
方策
model check
一般性問題
信頼性主義の問題
信頼できる(検定)プロセスの信頼性の基準が定まらない。正しい(認識)プロセスが一意に定まらない。
正確に説明するモデルだからって、予測性能は高いのか?
→ いいえ
存在とは
2つの立場
より確率モデルに近い方
典型的な統計家
説明能力を重視
より予測性能が高い方
要点
(形式)理論(および手法)と主義は独立である。
反論
形式的な(抽象的な)対象物を措定するして表現のは、実在(= 具体的な存在)である対応物の存在にコミットしたことには ならない。
(形式的)理論と実在論は別、とのこと
真の分布(= 確率モデル)は理論的な対象であって、現実に対応する具体物は存在しない。
有用性からして、実在(i.e. 確率種)である、という実在論は言える。wint.icon
形式的な世界と現実世界の区別は良く出てくる……というか、モデル化や形式化の基本的な世界観だろうwint.icon
他の立場・主義
尤度のみでモデルの優劣を決める立場
つまり事前分布を認めるとは限らない。
客観的なら みとめる。
主観的なら みとめない。
等価
十分性の原理
条件づけの原理
反事実的な実現は無関係で無視する。
頻度主義者はこれに反対する。
統計の分野
記述統計学
存在論としてはデータのみ
要約できる。
推測統計学
その斉一性を措定する。
世界の話
帰納推論できる。
因果推論
存在論においては、さらに因果モデルが必要
可能世界(群)の話
介入の予測・評価ができる。
分野
ref.
aka. ベイズ主義? Baysianism? wint.icon
vs. 頻度主義認識論?wint.icon
測定理論
有意味性の条件を探る
論者
エリオット・ソーバー
3分法
ベイズ主義
唯一、仮説の確率を認める。
尤度主義
単純仮説は扱えるが複合仮説は扱えない。
AIC が助けになる。
頻度主義
AIC は頻度論に分類できる という
ベイズ主義と尤度主義とを分けてることが特徴的かwint.icon
書籍
感想
review
エリオット・ソーバー『科学と証拠: 統計の哲学 入門』
ref.