PyData Osaka meetup #11 2019/10/19(Sat.)

event page

https://pydataosaka.connpass.com/event/150124/

---

Talk about Thomas Wiecki

本日

確率的プログラミングの紹介

Quantopian

アルゴリズムトレーディングプラットフォーム

14年以上Jupyter Notebookを使用

200k以上のメンバー、学習教材の提供

コンペティションを開催

ストラテジを共有

株式投資のリターンのヒストグラム

長い裾のを持つ

t検定でin-samplesの分布とout-of-sampleの分布を検証

ベイズモデリング: Coin flipping

事前分布p(θ) -> 尤度 p(x | θ) -> データ x (表、裏)

データとパラメータの関係性はこの流れだがベイズ推定はデータを与えて最も起こりやすい結果を予測

金融データのモデリング

潜在的な原因(パラメータ) -> データの分布(t分布) -> 観測データ

PyMC3

pythonの確率的プログラミングのフレームワーク

任意の確率分布をプラがぶるに互いに接続可能

直感的なモデル記述

`x ~ N(0,1) は x = Normal('x', 0, 1)

自動的でパワフルな推論機能

MCMC

ADVI(変分推定)

Theanoの上で動作

実際のモデル記述方法の説明

金融データの例においけるin-sampleとout-of-samplesの平均の事後確率

in-samplesは非常に細く尖った分布だがout-of-sampleは広い

out-of-sampleの平均がin-samplesよりも大きい確率質量は3.34%程度、非常に小さい

将来のリターンの予測

1. モデルを推定

2. モデルの不正確性を受け入れたリターンを生成

リターンが確率的に表現される

Bayesian Decision Making

予測結果に対してloss functionを定義しoptimizerと合わせて判定

予測

ノイズだけでなく不確実性を考慮

将来起こりうるすべてのシナリオ(異なるパラメータに基づく予測)を考慮する必要がある

Loss Function

eventとoutcomeを結びつける

outcomeは可能な限り意味のあるビジネス的な尺度に近いものであるべき

金融の場合は期待される損失を最小化する(winsを最大化するのは過度にリスクな振る舞いとなる)

Black-Littermann: -exp(-λr(ω))

r(ω)は次月に対するサンプルにおけるリターン、ωはポートフォリオweights、λはどれだけ損失がaverseであるか

`def loss_function(ω): ωと将来のsampleの内積をexpに通してlossに加算

Optimizer

ポートフォリオweights ωを見つけ出す

convex solvers(cvxpy)

速い

それ以外の場合はscipy.optimizer.fmin()を使う

A/B test