AAC
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/10/15 07:54 UTC 版)
符号化アルゴリズム
AAC (AAC-LC) の符号化処理は以下の流れで行われる。
- MDCTによる直交変換
- 入力は窓長 2048 もしくは 256 のMDCTを用いてそれぞれ 1024 点 (long block)、128 点 (short block) の周波数領域のデータに変換される。MP3が一旦時間領域のフィルタで 32 サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。
- 変換長は、入力信号の性質によって切り替えられる(アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32 サブバンド × 18 点)、short blockが 192 点相当(32 サブバンド × 6 点)であったMP3と比較してlong blockをより長くすることで周波数解像度の向上による符号化効率の改善がshort blockをより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。
- TNS
- ステレオ・コーディング
- 入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。
- なおステレオ・コーディングはサブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。
- インテンシティ・ステレオ
- 左右の信号を、単一の信号と定位情報のみに削減して符号化する。
- MSステレオ
- 左右の信号を和/差信号とする。
- 量子化
- 聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド(近い周波数のMDCT係数をまとめたグループ)毎に量子化を行う。long blockのスケールファクタ・バンドの数は49 (44.1kHz) であり、21 であったMP3と比較して細かい制御が可能になっている。
- ハフマン符号化
- 量子化された値を固定ハフマン符号化する。符号帳は 11 種類の中からサブバンド毎に選択される。
- ^ AACの仕様では1024サンプル当たり最大6144bpsと決められているので、1サンプル当たり6144÷1024=6bpsという計算になる。
- ^ 例えばCD音質の場合、最大2×44100×6=529200bps=529.2kbpsである。
- ^ “Audio/Video - The Chromium Projects”. www.chromium.org. 2021年5月29日閲覧。
- ^ “Supported Media Formats in Media Foundation, AAC Decoder”. Microsoft. 2021年5月29日閲覧。
- ^ “サポートされているメディア形式 | Android デベロッパー”. Android Developers. 2021年5月29日閲覧。
- ^ “[iPhone/iPad]再生できる音楽ファイル形式を教えてください。 | よくあるご質問(FAQ) | サポート”. ソフトバンク. 2021年5月29日閲覧。
- ^ 例えばiTunes Storeでは以前、拡張子が .m4p のAACが配信フォーマットとして用いられていたが、これにはiTunes Store独自のFairPlayというDRMが付加されていたため携帯電話で再生することができなかった。2009年にはiTunes Storeにおいて大半の曲がDRMフリーでリリースされた。ただし一部のメタ情報やデータコンテナの相違から、そのままのオーディオファイルを使用する場合に非互換性が残る場合がある。
- ^ 海上忍「いまさら聞けないiPhoneのなぜ 格安SIMでもFaceTimeオーディオは快適に使える?」『マイナビニュース』 マイナビ、2016年1月25日
- ^ “米Dolby、音声圧縮技術「MPEG-4 AAC」特許の一括ライセンスプログラムを開始”. 2002年4月4日時点のオリジナルよりアーカイブ。2002年3月27日閲覧。
固有名詞の分類
- AACのページへのリンク