音声合成インタフェース
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/23 01:31 UTC 版)
「MPEG-4 Part 3」の記事における「音声合成インタフェース」の解説
MPEG-4 では音声合成の共通インタフェースが定義されている。音声合成の具体的なアルゴリズムは定義しない。 基本となるインタフェース標準では、国際音声記号(International Phonetic Alphabet、IPA)の形式や、任意の言語でのテキスト形式で音声の情報を指定する。 MPEG-4 Hybrid/Multi-Level Scalable TTS Interface は基本インタフェースを拡張したもので、抑揚などの韻律情報も指定でき、より自然な音声が合成できる。ビットストリームは階層構造になっており、階層が増えるに従って韻律情報も増える。
※この「音声合成インタフェース」の解説は、「MPEG-4 Part 3」の解説の一部です。
「音声合成インタフェース」を含む「MPEG-4 Part 3」の記事については、「MPEG-4 Part 3」の概要を参照ください。
- 音声合成インタフェースのページへのリンク