datasets.load_datasetでJSONを読み込む
JSON https://huggingface.co/docs/datasets/loading#json
JSON files can have diverse formats, but we think the most efficient format is to have multiple JSON objects; each line represents an individual row of data.
「手元にあるJSON」とは、JSON Linesと考えてよさそう(複数のJSONオブジェクトなので)
ただし、JSON Linesだが、拡張子はjsonかcsvを想定
https://github.com/huggingface/transformers/blob/v4.17.0/examples/pytorch/text-classification/run_glue.py#L146
https://huggingface.co/docs/datasets/v2.0.0/en/package_reference/loading_methods#datasets.load_dataset
使用例としてユニットテストのコードを見る
https://github.com/huggingface/datasets/blob/2.0.0/tests/test_load.py#L781-L793
ドキュメントの説明と合わせても、JSONLファイルの中身を取得するだけ(loadで整形はしない)