ダイフォン音声合成
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 00:45 UTC 版)
音声データベースに目的言語のダイフォン(diphone、音素のペア)を保持し、それを使用して合成する。ダイフォンの個数はその言語の音素配列論により決まる(例えば、スペイン語なら約800、ドイツ語なら約2,500のダイフォンを持つ)。ダイフォン音声合成では、データベースは1つのダイフォンにつき1つの音声素片を保持しておけばよいので、データベースの大きさが単位選択合成と比較して圧倒的に小さくて済む。音声を合成する際には、ダイフォンを並べたものに線形予測分析法(PSOLA、MBROLAなど)のようなデジタル信号処理を施して韻律を作る。合成された音声は、単位選択型音声合成と比べて音質が劣る。単位選択型音声合成の発展などのため、近年では使われることが少ない。
※この「ダイフォン音声合成」の解説は、「音声合成」の解説の一部です。
「ダイフォン音声合成」を含む「音声合成」の記事については、「音声合成」の概要を参照ください。
- ダイフォン音声合成のページへのリンク