GLUEのデータのダウンロード
#GLUEベンチマーク
https://github.com/pytorch/fairseq/blob/11b2830d29aed8043e5011d64e14004347a08b50/examples/roberta/README.glue.md#1-download-the-data-from-glue-website-httpsgluebenchmarkcomtasks-using-following-commands
がうまくいかなかった
QNLIを取得しようとした(ALLでも最初のCoLAで同じエラー)
urllib.error.HTTPError: HTTP Error 403: Forbidden
https://gist.githubusercontent.com/W4ngatang/60c2bdb54d156a41194446737ce03e2e/raw/17b8dd0d724281ed7c3b2aeeda662b92809aadd5/download_glue_data.py
にURLのリストあり
URLにアクセスできなくなったらしい
https://firebasestorage.googleapis.com/v0/b/mtl-sentence-representations.appspot.com/o/data%2FQNLIv2.zip
をブラウザで開くと403 Forbidden
To everyone with the same issue: please try
https://github.com/nyu-mll/GLUE-baselines#downloading-glue.
ref:
https://github.com/pytorch/fairseq/issues/3840#issuecomment-913078184
https://github.com/nyu-mll/GLUE-baselines/blob/master/download_glue_data.py
から使う
確認時点(2022/02)で、このリポジトリ自体はdeprecated
Workaround
code:shell
$ wget
https://raw.githubusercontent.com/nyu-mll/GLUE-baselines/b1c82396d960fd9725517089822d15e31b9882f5/download_glue_data.py
$ python download_glue_data.py --data_dir glue_data --tasks QNLI