符号化アルゴリズム
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/22 14:51 UTC 版)
AAC (AAC-LC) の符号化処理は以下の流れで行われる。 MDCTによる直交変換入力は窓長 2048 もしくは 256 のMDCTを用いてそれぞれ 1024 点 (long block)、128 点 (short block) の周波数領域のデータに変換される。MP3が一旦時間領域のフィルタで 32 サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。 変換長は、入力信号の性質によって切り替えられる(アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32 サブバンド × 18 点)、short blockが 192 点相当(32 サブバンド × 6 点)であったMP3と比較してlong blockをより長くすることで周波数解像度の向上による符号化効率の改善がshort blockをより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。 TNS周波数領域の信号を、時間軸のものと見なした線形予測を行う。 周波数領域でのARモデル化は時間領域でのノイズ特性を持ち、人間の聴覚の持つ継時マスキング特性を再現するのに都合が良い。 この処理は省く事ができる。 ステレオ・コーディング入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。 なおステレオ・コーディングはサブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。 インテンシティ・ステレオ左右の信号を、単一の信号と定位情報のみに削減して符号化する。 MSステレオ左右の信号を和/差信号とする。 量子化聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド(近い周波数のMDCT係数をまとめたグループ)毎に量子化を行う。long blockのスケールファクタ・バンドの数は49 (44.1kHz) であり、21 であったMP3と比較して細かい制御が可能になっている。 ハフマン符号化量子化された値を固定ハフマン符号化する。符号帳は 11 種類の中からサブバンド毎に選択される。
※この「符号化アルゴリズム」の解説は、「AAC」の解説の一部です。
「符号化アルゴリズム」を含む「AAC」の記事については、「AAC」の概要を参照ください。
- 符号化アルゴリズムのページへのリンク