合成データ
画像生成
生成モデル
Diffusion Model
シミュレーション
Unity
Blender
Data-Centric AI
事前学習用画像データセット生成モジュールコンテスト 予選
https://signate.jp/competitions/1071
AI models collapse when trained on recursively generated data
https://www.nature.com/articles/s41586-024-07566-y
AI モデルが再帰的に生成されたデータで学習すると崩壊する
「合成データの作成について」松尾研 LLM コミュニティ "Paper & Hacks Vol.21"
https://www.youtube.com/watch?v=FupHEgGdJ5w
AI models collapse when trained on recursively generated data
https://www.nature.com/articles/s41586-024-07566-y
Synthetic Dataの利用
https://qiita.com/sakasegawa/items/676edabb25ed562d61d9
物体検出のデータセット構築においては3Dモデルを用いた合成データセットが有効であり (Peng at al., 2014)、現実世界のデータとのgap (Reality Gap) を埋めるためは適切にランダム化する必要があります (Tobin et al., 2017)。
また、3Dシーンからの合成データセット作成には非常に便利なライブラリがあり、Unity Perception などが有名です。
2024 in Synthetic Data and Smol Models LS Live @ NeurIPS
https://www.latent.space/p/2024-syndata-smolmodels
A Survey of Data Synthesis Approaches
https://arxiv.org/abs/2407.03672
Synthetic Data Paves the Way for Self-Driving Cars Helm.ai uses synthetic data to train autonomous vehicle systems
https://spectrum.ieee.org/synthetic-data-self-driving