隠れマルコフモデル音声合成
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 00:45 UTC 版)
「音声合成」の記事における「隠れマルコフモデル音声合成」の解説
隠れマルコフモデル (HMM) を音響モデルに用いた音声合成である。HMMにより音響特徴量系列を確率的に生成し、これをボコーダーにより音声波形へと変換する。 統計的パラメトリック音声合成の先駆けであり、東京工業大学のチームによって1999年に提案された。少数のパラメータで音声の特徴を表現でき、モデルの大きさや、モデルの学習および音声の合成に要する計算コストは小さい。携帯電話(フィーチャー・フォン)や電子手帳など、ハードウェアの制約が大きい端末でも動作する。また必要な録音時間も(商用の)単位選択型音声合成に比べて短くて済む。 モデルの単純さからスペクトルが人間の音声と比べて平滑なものになりがちであり、このため合成された音声は肉声感に乏しい。また、基本周波数の軌跡も単純なものになりがちである。
※この「隠れマルコフモデル音声合成」の解説は、「音声合成」の解説の一部です。
「隠れマルコフモデル音声合成」を含む「音声合成」の記事については、「音声合成」の概要を参照ください。
- 隠れマルコフモデル音声合成のページへのリンク