Pythonに競馬の予想をさせる
新人博士.iconは競馬が好きなのだが、頑張って予想しても当たらない
一方、機械学習は大量のデータを処理して予測を出すのが得意
競馬は大量のデータを取得することができる、機械学習にうってつけの題材
すでに結果の出ているレースを使って予測の答え合わせもできる
多数の説明変数から一つの目的変数を予測するという方法の合致
説明変数
過去のレースの結果
天気
枠順
コース
etc
目的変数
着順
どのようにして実装するか
1. データを用意する
すでにあるデータベースをコピペしても罪には問われないだろう
2. データの前処理
データの中にはそのままではコンピュータに扱えない形式のものがいくつかある
当日の天気やどこの競馬場かなど
これらをコンピュータに扱える形式に変換する必要がある
3. アルゴリズムの構築
まずは単純な仕組みから作る
例えば過去のレースのタイムから今回のレースのタイムだけを予測させるなど
最終的に全部の説明変数を読み込んだ上でレースの着順を予想するAIモデルを構築する
4. データの増強
データは頑張ればいくらでもとれる
手作業でやるのはつらい
しかしスクレイピングは法的にグレーだ
どうしよう