音声データセット
リンク集
日本語対話コーパス一覧 | Individuality.jp
コーパスリスト - 音声資源コンソーシアム
無償入手可能な音声コーパス/音声データベースの一覧 音声認識 - Qiita
広く書かれてある
Hugging Face – The AI community building the future.
A Complete Guide to Audio Datasets
Find Open Datasets and Machine Learning Projects | Kaggle
Kaggle に日本語で使いやすい最高ってやつはないイメージ
Shinnosuke Takamichi (高道 慎之介) - corpus
音声合成のコーパスをつくろう | PPT コーパス作りまくっている方
p13 めちゃいい
音声認識: 少人数より多人数、クリーンな環境より実環境
音声合成: 多人数より少人数、実環境よりクリーン環境
個別
Common Voice
JTubeSpeech
EIDC
koniwa/koniwa: An open collection of annotated voices in Japanese language
reazon-research/reazonspeech · Datasets at Hugging Face
https://abci.ai/ja/ に依存しており abci がメンテナンスで 2w とまったりしがちで結構厳しい
公開 | 先進的音声技術研究室 | ASTREC | UCRI | NICT
最近の SPREDS 特に良いのでは、CC BY 4.0 で助かる
こういうミーティングやプレゼンの実環境っぽいデータセット意外と少ないし
Shinnosuke Takamichi (高道 慎之介) - jtubespeech-asv_corpus
#音声 #データセット