可逆音声圧縮
可逆音声圧縮
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/04 16:58 UTC 版)
年々記録媒体のコストが低下し、またインターネットの通信速度も向上しているため、音声ファイルを永久的に保管するための形式として、Monkey's Audio、FLAC、Shorten などの可逆圧縮フォーマットがよく使われるようになってきている。特にレコーディング・エンジニアやオーディオマニアが可逆圧縮フォーマットをよく使う。圧縮率は汎用の可逆データ圧縮と同程度(オリジナルの50%から60%)である。Blu-ray DiscやHD DVD向けに Dolby TrueHD のような可逆圧縮フォーマットも登場している。 音声の全てのデータを保持しつつ、大幅な圧縮率を達成することは困難である。そもそも、実世界で録音された音声の構造は非常に複雑で、圧縮技法のひとつであるパターンの繰り返しの検出が困難である。画像の場合もコンピュータグラフィックスよりも実世界の写真の方が圧縮しにくいのと同じである。ただし音声の場合、コンピュータが生成した音も非常に複雑な波形を含み、多くの圧縮アルゴリズムでは圧縮が難しい。これは、音声波形が時系列のまま単純化するのが難しく、人間の耳で行われているように周波数領域に(必要なら可逆に)変換してやる必要があるためである。 また、音声の標本化された値は非常に素早く変化するため、汎用のデータ圧縮アルゴリズムでは音声をうまく扱えず、同じバイト列が何度も繰り返されることもほとんどない。[-1 1]フィルタによる畳み込みは、スペクトルを若干ホワイトノイズ化(平坦化)する傾向があり、そのため可逆圧縮のエンコーダで利用される。その場合、デコーダが逆の操作を行って元の信号を復元する。FLAC、Shorten、TTA といったコーデックは、信号の周波数スペクトルを推定するのに線形予測法を用いる。エンコーダでは、その予測の逆を行って周波数スペクトルのピークを小さくすることでホワイトノイズ化し、デコーダは線形予測法をそのまま使って元の信号を再構築する。 可逆オーディオコーデックは音質には問題がないため、有用性は以下の観点で判断される。 圧縮・伸張の速度 圧縮率 対応するビット深度・サンプリングレート・チャンネル数 ソフトウェア・ハードウェアでの採用状況 誤り訂正能力 データ上の劣化は存在しないが、デコーダの性能などによって音質の劣化が発生し得る。オーディオマニアの間ではスーパーオーディオCDの圧縮を好まない傾向があり、ユニバーサルミュージックの「SACD~SHM仕様~」など非圧縮にこだわったソフトがリリースされている。
※この「可逆音声圧縮」の解説は、「音声圧縮」の解説の一部です。
「可逆音声圧縮」を含む「音声圧縮」の記事については、「音声圧縮」の概要を参照ください。
- 可逆音声圧縮のページへのリンク