CeVIO AIの技術背景
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/01 09:21 UTC 版)
「CeVIO」の記事における「CeVIO AIの技術背景」の解説
名古屋工業大学 国際音声言語技術研究所、および名工大ベンチャー企業であるテクノスピーチ社によって研究開発された音声合成技術を使用する。 CeVIO CSと同様の統計的パラメトリック音声合成ではあるが、深層学習によるDNN音声合成や回帰型ニューラルネットワーク(RNN)を用いて従来よりも自然な歌声・話し声を実現した。また、畳み込みニューラルネットワーク(CNN)を持ちいた計算量削減などの手法も行われている。 姉妹ソフトであるSinsyは2018年からDNN版が存在した が、Open JTalkはCeVIO AIリリース時にはDNN版が公開されておらず、CeVIO AIが技術的に先行することとなった。なお、Sinsy・Open JTalk・CeVIO AIが共通で利用する音声合成学習モデルツールキットの「HTS」は2017年12月25日にDNN版が公開されている。
※この「CeVIO AIの技術背景」の解説は、「CeVIO」の解説の一部です。
「CeVIO AIの技術背景」を含む「CeVIO」の記事については、「CeVIO」の概要を参照ください。
- CeVIO AIの技術背景のページへのリンク