LLMに食わせるデータがもうない
背景:
Scalling law(Kaplan et al., 2020)
@ImAI_Eruel
: ...
実はデータ量も2026年にWebデータ枯渇の試算(
https://arxiv.org/abs/2211.04325
)があり,AIの進化は落ち着く可能性が
2211.04325 Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning
インターネット以前の文献の電子化は?
基素.icon
ネットにない情報がたくさんある
BigTechは社内図書館を持って本を購入して学習させている
Anthoropic海賊版ダウンロード訴訟
でフェアユースが成立している
@motoso
: 人間の役割は特殊な例をたくさんつくってAIに食べさせることになっていくんだろうな
平均より外れ値が有益
データがなくてもいいんじゃないかアプローチ
January 4, 2026
AI may not need massive training data after all | ScienceDaily