llm-japanese-dataset v0 データセット詳細
8.4M事例が含まれており、そのうち75%が翻訳タスク
https://gyazo.com/592aaa53346ce0f8f5eb5797c492fa9a
その他含まれているデータ
https://gyazo.com/6f1dcc2c4161d0e56c0b07cf0e807081
https://gyazo.com/239579e1a9e55d954447faadb0d6c246
https://gyazo.com/93738da68c35276de7a882d613c7cfb9
https://gyazo.com/979c21a443d9e169e2c88fbbe27c7e77
https://gyazo.com/e39396cbcee0af6d50931961899d0b5c
https://gyazo.com/7dc3d45b56402b1a32ef0579b22e16e2
https://gyazo.com/52b734bf2bd5a8c1d17db1a448b1a891
https://gyazo.com/e46fadb4f65b5daa870b2d39b8fc4615
https://gyazo.com/c862560d15b55d4ec07b7b672c9b8b91
https://gyazo.com/49bdde6dc76213e66abbc9d27b51b762
Japanese Alpaca LoRA
後に非商用ライセンスに変更されたため除外
databricks-dolly-15k-ja