変換領域
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/04 16:58 UTC 版)
知覚的に不要な音声信号内の部分を特定するため、多くの非可逆圧縮アルゴリズムでは時間領域の標本波形を変換領域にコンバートするため、修正離散コサイン変換 (MDCT) などを使う。一般に周波数領域に変換すると、周波数成分ごとに可聴性を考慮してビットが割り当てられる。周波数成分の可聴性は、まずマスキングしきい値を計算し、それ未満の音は人間には知覚されないと判断する。 マスキングしきい値の計算には、最小可聴値と同時マスキングの原理を使い、場合によっては経時マスキングも利用する。等ラウドネス曲線を使って各周波数成分の重み付けも行うことがある。このような脳も含めた人間の聴覚モデルに基づいた現象群を心理音響モデルと呼ぶ。
※この「変換領域」の解説は、「音声圧縮」の解説の一部です。
「変換領域」を含む「音声圧縮」の記事については、「音声圧縮」の概要を参照ください。
- 変換領域のページへのリンク