データ生成(合成データ)
事前学習用画像データセット生成モジュールコンテスト 予選
AI models collapse when trained on recursively generated data
AI モデルが再帰的に生成されたデータで学習すると崩壊する
「合成データの作成について」松尾研 LLM コミュニティ "Paper & Hacks Vol.21"
https://www.youtube.com/watch?v=FupHEgGdJ5w
AI models collapse when trained on recursively generated data
Synthetic Dataの利用
物体検出のデータセット構築においては3Dモデルを用いた合成データセットが有効であり (Peng at al., 2014)、現実世界のデータとのgap (Reality Gap) を埋めるためは適切にランダム化する必要があります (Tobin et al., 2017)。
また、3Dシーンからの合成データセット作成には非常に便利なライブラリがあり、Unity Perception などが有名です。