スペクトログラム
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/09/16 06:59 UTC 版)
派生
メルスペクトログラム
メルスペクトログラム(英: mel spectrogram)は周波数軸がメル尺度のスペクトログラムである。
メルスペクトログラムは(リニア)スペクトログラムにメルフィルターバンクを適用して生成されることが多く、その場合は周波数軸の次元数が小さくなる。すなわち聴覚特性に基づいた次元圧縮としても機能するため、信号処理、特にディープラーニングの前処理でしばしば用いられる[5]。
脚注
参考文献
- 小野順貴「短時間フーリエ変換の基礎と応用」『日本音響学会誌』第72巻第12号、日本音響学会、2016年、 764-769頁、 doi:10.20697/jasj.72.12_764。
関連項目
外部リンク
- Sonogram Visible Speech Javaで書かれたスペクトログラム生成ソフト。Java WebStart により直接ウェブページから起動できる。
- エイフェックス・ツインのスペクトログラム画像
- DiscreteTFDs - スペクトログラムなどを計算するソフトウェア(MATLAB用)
- Praat - 音声学用ソフトウェア
- KTH WaveSurfer - 音声視覚化ソフトウェア
- baudline signal analyzer - FFTスペクトログラムソフトウェア
- xeno-canto 3100以上の鳥の鳴き声のスペクトログラム
- ^ "A(m, k) は振幅スペクトログラム(小野順貴(2016))
- ^ " はパワースペクトログラムと呼ばれる。(小野順貴(2016))
- ^ "Compute dB relative to peak power ... librosa.power_to_db(S**2, ref=np.max)" librosa 0.9.1.
- ^ "compare to median power >>> librosa.power_to_db(S**2, ref=np.median)" librosa 0.9.1.
- ^ "ニューラルボコーダはメルスペクトログラムなどの音響特徴量から音声を復元するボコーダに深層学習を適用したもの" 松原. (2021). HiFi-GAN ボコーダにおける LPCNet 特徴量の検討. 日本音響学会.
スペクトログラムと同じ種類の言葉
- スペクトログラムのページへのリンク