統計的パラメトリック音声合成
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 00:45 UTC 版)
「音声合成」の記事における「統計的パラメトリック音声合成」の解説
統計的パラメトリック音声合成(英: statistical parametric speech synthesis; SPSS)は統計モデルに基づく音声合成、すなわち確率的音声合成の総称である。 録音された音声から音声の特徴を学習したパラメトリックな生成モデルを作り、その生成モデルの出力を元に音声を合成する。波形接続型音声合成では条件次第で合成された音声の滑らかさに問題が生じうるが、統計的音声合成では基本的には滑らかな音声を合成できる。また手法により、複数話者の中間声質、感情が込められた変化の激しい音声など、柔軟で多様な音声合成が可能である。
※この「統計的パラメトリック音声合成」の解説は、「音声合成」の解説の一部です。
「統計的パラメトリック音声合成」を含む「音声合成」の記事については、「音声合成」の概要を参照ください。
- 統計的パラメトリック音声合成のページへのリンク