スペクトログラム
(声紋 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/13 13:21 UTC 版)
スペクトログラム(英: Spectrogram)とは、複合信号を窓関数に通して、周波数スペクトルを計算した結果を指す。3次元のグラフ(時間、周波数、信号成分の強さ)で表される。
- ^ "A(m, k) は振幅スペクトログラム(小野順貴(2016))
- ^ " はパワースペクトログラムと呼ばれる。(小野順貴(2016))
- ^ "Compute dB relative to peak power ... librosa.power_to_db(S**2, ref=np.max)" librosa 0.9.1.
- ^ "compare to median power >>> librosa.power_to_db(S**2, ref=np.median)" librosa 0.9.1.
- ^ "ニューラルボコーダはメルスペクトログラムなどの音響特徴量から音声を復元するボコーダに深層学習を適用したもの" 松原. (2021). HiFi-GAN ボコーダにおける LPCNet 特徴量の検討. 日本音響学会.
- ^ "メルフィルタバンクも不可逆な変換である." 以下より引用。田口. (2020). 深層学習を用いたデータ駆動型調音・音声間変換に関する研究. 九州大学.
- ^ "メルスペクトログラムから振幅スペクトルへの復元は非負拘束最小二乗法 ... によって得られる." 以下より引用。田口. (2020). 深層学習を用いたデータ駆動型調音・音声間変換に関する研究. 九州大学.
- ^ "specgram = torch.relu(torch.linalg.lstsq" 以下より引用。PyTorch. torchaudio.transforms._transforms. 公式HP. 2024-06-13 閲覧.
- 1 スペクトログラムとは
- 2 スペクトログラムの概要
- 3 派生
声紋
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/14 07:29 UTC 版)
発生の仕組みから、「基本振動音」を作り出す声帯とその振動音を声に変化させる声道の大きさや形は個人毎に異なるため声も個人特有なものとなる。声をスペクトログラムで分析すると各人の違いを見ることが出来、声紋を検出することが出来る。一般には身長の高い人は声帯も声道もより大きく低い声となる。声紋を分析することで性別・顔形・身長・年齢等を特定することが出来、個人認証や犯罪捜査に利用されている。
※この「声紋」の解説は、「声」の解説の一部です。
「声紋」を含む「声」の記事については、「声」の概要を参照ください。
「声紋」の例文・使い方・用例・文例
- >> 「声紋」を含む用語の索引
- 声紋のページへのリンク