閉ループ型学習による音声合成技術
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/14 09:00 UTC 版)
「赤嶺政巳」の記事における「閉ループ型学習による音声合成技術」の解説
カーナビゲーション、駅のホームアナウンス、金融機関などのコールセンターの自動応答、ATMや家電製品のガイド、あるいはパソコンの読み上げソフトなど、現代ではいたるところで合成音声が使用されている。しかし、その音声は音質が悪く、機械的であるという欠点があった。 赤嶺は、音声データから音声合成のパラメーターを自動学習することを基本方針に掲げ、音質の問題を学習データとの誤差という形で定式化することに成功した。続いて、その定式化に基づいて合成音の誤差を最小化する素片辞書の学習方式を世界で初めて開発し、「閉ループ学習法」と命名した。本方式は、最小の素片で音質を最大化するものであり、省メモリーで人間並みの高音質・自然な合成音を実現する画期的な方法であった。 この技術は、カーナビの音声案内やビデオゲーム、電子辞書などに広く使われ、特にカーナビゲーションでは9割近いシェアを占めている。また、この学習法は言語に依存せず、どんな言語でも使用が可能であり、米語、イギリス英語、スペイン語、フランス語、イタリア語、ドイツ語、オランダ語、中国語などの音声合成にも使用されている。
※この「閉ループ型学習による音声合成技術」の解説は、「赤嶺政巳」の解説の一部です。
「閉ループ型学習による音声合成技術」を含む「赤嶺政巳」の記事については、「赤嶺政巳」の概要を参照ください。
- 閉ループ型学習による音声合成技術のページへのリンク