Dolma
事前学習用データセット
URL
https://huggingface.co/datasets/allenai/dolma
サイズ
4.5 TB
ライセンス
ODC-BY
カテゴリー
mix of web content, academic publications, code, books, and encyclopedic materials