音声データベース
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/06/06 05:01 UTC 版)
「Common Voice」の記事における「音声データベース」の解説
英語版Common Voiceデータベースは、自由にアクセス可能な音声データベースとしては、LibriSpeechに次ぐ規模である。2017年11月29日に最初のデータが公開された時点で世界中の2万人以上のユーザーによって、40万の検証済みの音声が登録され、録音時間は合計500時間に及んだ。 2019年2月、最初のバージョンのコーパスがリリースされ、これには18の言語の音声が含まれている。英語、フランス語、ドイツ語、中国語のほか、ウェールズ語やカビル語などの少数言語の音声も含まれている。全体として、42,000人以上の貢献者による約1,400時間の録音音声データが含まれている。 2020年12月現在、60言語、9,283時間の音声記録がデータベースに蓄積されており、そのうち7,335時間分がボランティアによって検証済みである。
※この「音声データベース」の解説は、「Common Voice」の解説の一部です。
「音声データベース」を含む「Common Voice」の記事については、「Common Voice」の概要を参照ください。
- 音声データベースのページへのリンク