フェーズボコーダ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/11/12 17:30 UTC 版)
フェーズボコーダ(英語: Phase vocoder)は音声信号を周波数領域の振幅と位相でモデル化するボコーダである[1][注釈 1]。
- ^ "The method specifies the speech signal in terms of its short-time amplitude and phase spectra. For this reason, it is called phase vocoder." Flanagan, et al. (1966). Phase Vocoder.
- ^ Flanagan, J.L.; Golden, R.M. (1966), “Phase vocoder”, Bell System Technical Journal 45 (9): 1493–1509
- ^ Griffin, D.; Lim, J. (1984), “Signal Estimation from Modified Short-Time Fourier Transform”, IEEE Transactions on Acoustics, Speech and Signal Processing 32 (2): 236–243, doi:10.1109/TASSP.1984.1164317
- ^ Laroche, Jean; Dolson, Mark (1999), “Improved Phase Vocoder Time-Scale Modification of Audio”, IEEE Transactions on Speech and Audio Processing 7 (3): 323–332, doi:10.1109/89.759041
- ^ Röbel, Axel (IRCAM) (2003), “A new approach to transient processing in the phase vocoder”, DAFx-03: Proc. of the 6th Int. Conference on Digital Audio Effects, オリジナルの2004年6月17日時点におけるアーカイブ。
- ^ SuperVP (Software), Analysis-Synthesis Team, IRCAM
SuperVP (Super Phase Vocoder)は、IRCAM で使われている 拡張フェーズボコーダ であり、その提供機能は、タイムストレッチ、ピッチシフト、フィルタリング、クロスシンセシス、音源分離とリミックス、構成成分のトリートメントと再構築、ノイズ除去、等。 AudioSculptのカーネルとして、Sinusoidal modelingを提供するPm2ライブラリと共に使用されている。 - ^ Wishart, Trevor (Winter, 1988), “The Composition of Vox 5”, Computer Music Journal 12 (4): 21–27, JSTOR 3680150
- ^ Serra, Xavier (1989), “A System for Sound Analysis/Transformation/Synthesis based on a Deterministic plus Stochastic Decomposition”, PhD thesis (Stanford University): p. 12, CiteSeerx: 10.1.1.76.2306
- ^ Mary Bellis, Who Invented Auto-Tune?, Harold Hildebrand aka Dr Andy Hildebrand Invented Auto-Tune, About.com, 2014年7月26日閲覧.
- ^ Joe Diaz, The Fate of Auto-Tune, マサチューセッツ工科大学, 2009.
- 1 フェーズボコーダとは
- 2 フェーズボコーダの概要
- 3 関連項目
- 4 参考文献
フェーズボコーダ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/10 09:08 UTC 版)
「タイムストレッチ/ピッチシフト」の記事における「フェーズボコーダ」の解説
詳細は「フェーズボコーダ」を参照 ピッチに影響を与えずに信号の長さを変える一つの方法は、Flanagan & Golden 1966, Portnoff 1976 らに従ってフェーズボコーダを組み立てる事である。 基本ステップ: 分析: STFTを使って信号の瞬時周波数と瞬時振幅の組を計算する: STFTとは、短くて互いにオーバーラップした、スムーズな窓関数適用でブロック化した信号サンプルを、離散フーリエ変換 (DFT) したものである。 変更: STFTの位相や振幅になんらかの処理を適用 (たとえばFFTブロックのリサンプリング[要説明]); 合成: 逆STFTの実行: 各FFTブロックを逆フーリエ変換 (IFT) し、得られた短いサンプル波形を足し合わせる。波形重畳法 (OLA)とも呼ばれる。 フェーズボコーダは正弦波成分をうまく扱うことができるが、初期実装系では非整数比の時間スケール伸縮で トランジェント ("beat") 波形にかなりの不鮮明さ(smearing)が生じ、これが位相のずれた散漫な結果(the results phasey and diffuse)をもたらす。[要説明](訳注: フェーズボコーダ#位相コヒーレンス問題参照) 最近の改善により全ての比の時間スケール伸縮でより品質の高い結果が得られるようになったが、 依然として不鮮明な残留成分が残っている。[要説明] またフェーズボコーダ技術は、ピッチシフト/コーラス効果/音色操作/ハーモナイズ効果/その他特殊な変更などの実現に使用でき、これらは全て時間の関数として変化させる事ができる。[要説明]
※この「フェーズボコーダ」の解説は、「タイムストレッチ/ピッチシフト」の解説の一部です。
「フェーズボコーダ」を含む「タイムストレッチ/ピッチシフト」の記事については、「タイムストレッチ/ピッチシフト」の概要を参照ください。
- フェーズボコーダのページへのリンク