第3層以上
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/06/17 20:24 UTC 版)
第3層以上の層は広帯域版でのみ使われ、サンプリング周波数は 16kHz である。 これらの層では、第2層までで符号化できなかった残差部分を MDCT を用いて周波数領域の係数に変換し、入力信号の性質と人間の聴感特性に合わせてそれらを符号化する。 一般に、音声と音楽ではその音の性質がかなり異なる。G.718 では、信号に音声成分が多いか音楽成分が多いかを判定し、第3層と第4層で使われる符号化方法を切り替える。 音声/音楽の判定には第2層以下で符号化できた信号と実際の入力信号との周波数領域での差を調べることで行う。第2層以下は音声符号化用のアルゴリズムを用いているため音楽などを含む信号はうまく符号化ができず、実際の入力信号より符号化後の信号のほうがエネルギーが大きくなる領域が多くなる。これを利用し符号化後のエネルギーが大きくなる領域のエネルギーの総和を求めることで判定を行う。 音声成分が多い場合、第3層と第3層では AVQ(algebraic vector quantization)と呼ばれる方法が使われる。 音楽成分が多い場合、第3層では BS-SGC(band-selective shape-gain vector quantization)が、第4層は FPC(factorial pulse coding)と呼ばれる方法が使われる。 第5層では常に FPC(factorial pulse coding)が使われる。それ以下の層で符号化できなかった周波数領域での残差を符号化する。 第3層以上で使われる MDCT 係数の符号化方式を以下の表にまとめる。 G.729.1 の第3層以上で使われる符号化方式階層符号化方式説明3AVG(algebraic vector quantization) 音声(voice)成分が多い場合 BS-SGC(band-selective shape-gain vector quantization) 音楽(music)成分が多い場合 4AVG(algebraic vector quantization) 音声(voice)成分が多い場合 FPC(factorial pulse coding) 音楽(music)成分が多い場合 5FPC(factorial pulse coding)
※この「第3層以上」の解説は、「G.718」の解説の一部です。
「第3層以上」を含む「G.718」の記事については、「G.718」の概要を参照ください。
- 第3層以上のページへのリンク