時系列データ
iid
iid = Independent and Identically Distributed 系列
各時点のデータが互いに独立で同じ分布に従う系列
期待値、分散から $ y_t \sim iid(\mu, \sigma^2) と書くけど分布は仮定してないしこの2個のパラメータで決まらない
強定常
ホワイトノイズ
$ \varepsilon_t は期待値 0 で分散が一定, 同時点以外の自己共分散が 0
弱定常
正規分布に従う時正規ホワイトノイズ $ y_t \sim \mathcal{N}(0, \sigma^2)
自己相関
k 次の自己相関 = 系列を k ずらした値との相関係数
自己共分散を [-1, 1] に正規化したもの
自己共分散
$ \text{Cov}(y_t, y_{t-k}) = E[(y_t - \mu_t)(y_{t-k} - \mu_{t-k})]
$ \mu_tと $ \mu_{t-k} って、定常性を仮定していたら同じでいいし、実際に求めるとしても末尾の値を k 個捨てただけ?
めちゃ長い系列の場合はほぼ同じ値になる?
これを正規化
$ \rho_{tk} = \text{Corr}(y_t, y_{t-k}) = \frac{\text{Cov}(y_t, y_{t-k})}{\sqrt{V(y_t) V(y_{t-k})}}
標準偏差の積で割る
偏自己相関
ランダムウォーク系列
iid 系列の累積和(増分が iid)
世の中のランダムウォークは別に iid じゃない気がする
累積的で次時点の変化が予測できない(独立に見える)程度の意味?
非定常
対数系列
現系列 $ y_t の対数を取ったもの
データのばらつきを正規分布に近づける
乗法的な構造を加法的にする
系列 = トレンド * 季節性 * ノイズ
log(系列) = log(トレンド) + log(季節性) + log(ノイズ)
対数差分系列は増減率の近似として使える