過学習
統計学の分野では過剰適合とも呼ばれる。
「過学習」というのは、あるデータでは優れていたはずのモデルが、他のデータに対しては全く使い物にならない、という状態のこと
入力データの量が少ない、偏っていることや予測のモデルが複雑なことが要員で起こりえる。または手元のデータで完璧な予想をもとめすぎてしまうことも原因の一つ。
回避の方法
手元のデータの一部を学習用に、残りのデータをテスト用にして、手元のデータで予想モデルの妥当性を検証する、「交差検証」など。
引用および参考
人工知能/AIならAILearn(あいらーん) 機械学習の天敵「過学習」とは何か? 2019/12/10
https://ailearn.biz/learn/20171119349
#テーマ5