XLSum-ja
from
JP Language Model Evaluation Harness
https://huggingface.co/datasets/mkshing/xlsum_ja?row=0
BBCの記事と要約のペア135万件からなる包括的で多様なデータセット
このデータセットは、低リソースから高リソースまで45の言語をカバーしている。
XL-Sumは高度に抽象化され、簡潔であり、人間による評価と内在的評価によって高い品質が示されている。