MaA-2025F-2.@2025-04-21T13:00D90
誤差まわりの言葉の定義
真値
最確値
測定値
誤差
偏り(bias)
真値と最尤推定値との差測定に関する用語の説明 | 電気回路演習 (実験ガイド-1)
偏差
残差
偏差と残差の定義が文献によってばらついていて紛らわしいtakker.icon
測定値を$ M_\bulletとするとこんな感じ
標本平均$ \overline{M}=\frac1n\sum_{0<i\le n}M_i
$ n:測定回数
最尤推定値$ m=\lim_{n\to\infty}M_n (母集団が可算無限個の場合)
測定値$ M_iの偏差:$ M_i-m
測定値$ M_iの残差:$ M_i-\overline{M}
最確値=最尤推定値だが、母平均と最尤推定値が同義かどうかは不明
References
誤差と残差と偏差と精度を中心に
測定に関する用語の説明 | 電気回路演習 (実験ガイド-1)
誤差の種類
1. 過失誤差
物差しが10cm長かったとか
2. 系統的誤差:何かの原因により規則的に生じる誤差
機械誤差:個々の計測機械がもつ固有の誤差.
理論誤差:理論的計算によって補正できる誤差
代表例としては温度による目盛のずれによ誤差.
温度誤差がこれに当たるtakker.icon
個人誤差:個人の読み取りの癖に起因する誤差.
例:メスシリンダー
メニスカスの下を見ないとだめ
適切に対処すれば取り除けるerrors
制御できるerrorsともいえる
3. 偶然誤差:原因が分からない誤差
制御できないような測定条件や環境条件などのわずかな変動により偶発的に発生する誤差.
white noiseやrandom noiseなどといわれるのがこれ
『計測工学』より
この辺『ゼロから学ぶ土木の基本 測量』と同じtakker.icon
同じ文献を参照してるのかも
誤差じゃなくて残差と呼ぶべきだと思うが、なんでか知らないが全部「XX誤差」と呼んでいる
以下、偶然誤差をできるだけ除くための統計的処理の話をする
確率密度函数
連続型確率変数$ X の累積分布函数$ F_X:\R\ni x\mapsto P(X^\gets(\R_{\le x}))\in[0,1] にて、$ F_X(x)=\int_{t\le x}f_X(t)\mathrm dtを満たす$ f_Xを、確率変数$ Xの確率密度函数と呼ぶ
ここで、$ \int_x^{x+\varDelta x}f_X(t)\mathrm dt=F_X(x+\varDelta x)-F_X(x)
$ = P(X^\gets(\R_{\le x+\varDelta x}))-P(X^\gets(\R_{\le x}))
$ = P(X^\gets([x,x+\varDelta x]))
$ \therefore P(X^\gets([x,x+\mathrm d x]))=\mathrm dF_X(x)=F_X(x+\mathrm dx)-F_X(x)=f_X(x)\mathrm dx
すなわち、$ Xが$ xから$ x+\mathrm d xまでの値を取りうる事象が起こりうる確率は$ f_X(x)\mathrm dxと表される
ある測定による偶然誤差を確率変数$ Xで表す。
誤差$ \varepsilonが$ x\le\varepsilon\le x+\mathrm dxとなる確率は$ f_X(x)\mathrm dx である
誤差の3公理より$ f_Xは正規分布$ f_X:x\mapsto\frac1{\sqrt{2\pi}\sigma}\exp\left(-\frac{1}{2\sigma^2}(x-\mu)^2\right)に従う
$ \sigma:=\sqrt{\operatorname{Var}(X)}:標準偏差
$ \mu:=\operatorname{E}(X):平均
母平均か標本平均かはわからないtakker.icon
通常は正規分布を使う
たいていの物は正規分布に従う
中心極限定理の存在もある
期待値と分散
確率変数
$ p_X(i)は確率質量函数に相当する
例:サイコロの期待値を求める
$ \Omega:=\{1,2,3,4,5,6\},\mathcal F:=2^\Omega とし、$ P:\mathcal F\to[0,1] を$ \forall i\in\Omega:P(\{i\})=\frac16を満たす函数とすれば、サイコロの目の確率は確率空間$ (\Omega,\mathcal F,P)に従う
サイコロの目は確率変数$ X:\Omega\ni i\mapsto i\in\Omegaで表せる
よって、サイコロの$ iの目が出る確率は、確率質量函数$ p_X(i):=P(X^\gets(\{i\}))で表せる
この時$ Xの期待値は、
$ \operatorname E(X)=\sum_{i\in\Omega} ip_X(i)
ここが一般的な期待値の定義に沿っているのか不安takker.icon
一般には、統計量$ g:\Chi\to\Rの期待値を$ \operatorname E(g):=\sum_{i\in\Chi}g(i)p_X(i)と定義する
$ =\frac16+\frac26+\frac36+\frac46+\frac56+\frac66
$ =3.5
$ Xの分散は
$ \operatorname{Var}(X)=\sum_{1<i}(i-\operatorname E(X))^2p_i
$ =\frac16((1-3.5)^2+(2-3.5)^2+(3-3.5)^2+(4-3.5)^2+(5-3.5)^2+(6-3.5)^2)
$ = \frac16((-2.5)^2+(-1.5)^2+(-0.5)^2+(0.5)^2+(1.5)^2+(2.5)^2)
$ =\frac13(2.5^2+1.5^2+0.5^2)
$ = \frac1{12}(25+9+1)
$ = \frac{35}{12}
$ \simeq2.916\cdots
となる
共分散
$ \operatorname{Cov}(X,Y):=\operatorname E((X-\operatorname E(X))(Y-\operatorname E(Y)))
分散共分散行列
$ \operatorname\Sigma(X,Y):=\begin{pmatrix}\operatorname{Cov}(X,X)&\operatorname{Cov}(X,Y)\\\operatorname{Cov}(Y,X)&\operatorname{Cov}(Y,Y)\end{pmatrix}
問いの解答
(private repo)https://github.com/takker99/MaA-2025F/blob/e939cd6778511a43647ad49eff97d80bb4146436/week1/question.ipynb
#2025-04-21 12:40:16
#2025-04-15 11:55:57
#2025-04-14 15:46:54