Log Area Ratio
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/06/25 17:22 UTC 版)
Log Area Ratio(LAR、ログ面積比)は線形予測係数と等価なパラメータで、音声符号化などで使われる。同様の目的でよく使われている線スペクトル対ほど効率的ではないが、単純に計算できるため GSM の最初の音声コーデックである GSM-FR などで使用されていた。
概要
携帯電話やVoIPなどで音声符号化を行う際、音声の特徴の1つである声道の周波数特性を線形予測フィルターの係数としてパラメータ化する。しかし線形予測係数は補間が行いにくく量子化誤差にも敏感なため、通常は線形予測係数と等価な別の扱いやすいパラメータに変換してから送信する。
LAR はそのようなパラメータの一つで、声道を固定長で一定の直径を持つ音響管の並びとしてモデル化した時、隣り合う音響管の面積比(area ratio)の対数にあたる係数である。線形予測の次数にあたる音響管の数を p 、それぞれの音響管の面積を Ai とすると、LAR の各係数 LARi は以下のように表現できる [1]。
脚注
- ↑ D. Chow, W.H. Abdulla. Speaker Identification Based on Log Area Ratio and Gaussian Mixture Models in Narrow-Band Speech.(pdf) Lecture Notes in Computer Science, Vol. 3157/2004, Springer Berlin / Heidelberg, pp.901-908. 2004.
参考文献
- Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
- D. Chow, W.H. Abdulla. Speaker Identification Based on Log Area Ratio and Gaussian Mixture Models in Narrow-Band Speech.(pdf) Lecture Notes in Computer Science, Vol. 3157/2004, Springer Berlin / Heidelberg, pp.901-908. 2004.
関連項目
「Log Area Ratio」の例文・使い方・用例・文例
- Log_Area_Ratioのページへのリンク
