汎化性能
真の関数との誤差が小さいモデル→汎化性能が高い:未知のデータに対する予測能力が高い
たとえば
スーパーマーケットにロボットが配属されたとする。
そのロボットが過去の顧客の購買情報を分析し、何らかのパターンを見つけた。
このパターンから今後の購買情報の予測を立てた。
→ではこの予想の有用さを測るには?
2つのパターンが考えらえる。
①パターンを導き出した過去データを用いてその予測の有用性を計測。
②ロボットの訓練時には無かった未来のデータを用いて予測の有用性を計測。
→どちらが適切か?
答えは②
過去データにおいて見つけた規則性がそのデータ内でうまくいくのは当然。極端な話、過去データそのものを覚えれば過去データ内での予測は完全にできる。
だからこそ、未知のデータでうまくいくか検証することが大事。この能力が高いと汎化性能が高いということになる。
#テーマ5
大学4年間のデータサイエンスが10時間でざっと学べる , 久野 遼平 (著), 木脇 太一 (著), KADOKAWA (2018/3/29)