スペクトログラムとは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 社会 > 社会一般 > > スペクトログラムの意味・解説 

スペクトログラム

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/13 13:21 UTC 版)

バイオリンのスペクトログラム(縦軸は線形周波数、横軸は時間)。色の線(すなわち輝点の連続)が周波数成分の経時変化を表す。色の明度は対数的(黒は −120dBFS)

スペクトログラム: Spectrogram)とは、複合信号窓関数に通して、周波数スペクトルを計算した結果を指す。3次元のグラフ(時間、周波数、信号成分の強さ)で表される。

スペクトログラムは声紋の鑑定、動物の鳴き声の分析、音楽ソナー/レーダー音声処理などに使われている。スペクトログラムを声紋と呼ぶこともある。スペクトログラムを生成する機器をソノグラフ(sonograph)という。

形式

最も一般的な形式では、横軸が時間を表し、縦軸が周波数を表す。そして、各点の明るさや色である時点のある周波数での強度を表す。

形式には様々なバリエーションがある。横軸と縦軸を入れ替えて、時間が上下に流れる形式にすることもある。また、強さをZ軸とした3次元のグラフで描画することもある。周波数は線型目盛でも対数目盛でもよく、用途によって使い分ける。例えば音声信号で倍音の関係を示す場合は周波数を線型目盛で表し、音楽的または音色的関係を表す場合は周波数を対数目盛で表す。

強度

振幅の大きさをもって強度とするものを振幅スペクトログラム: amplitude spectrogram[1]、振幅の2乗をもって強度とするものをパワースペクトログラム: power spectrogram)という[2]

強度はしばしばレベル表現対数スケール)で表される。基準量は用途によって異なり、純粋に対数表現するならば

男性が「タタタ」と発声したときのスペクトログラム
女性が「みなと」と発声したときのスペクトログラム

スペクトログラムを作成する方法は主に2種類存在する。1つはバンドパスフィルタ群を使う方法、もう1つは短時間フーリエ変換(STFT)で計算する方法である。

フィルタを使った手法は主にアナログの連続信号で使われる。信号の周波数範囲(音声信号の場合、20Hz から 20kHz)を等間隔に分ける。ただし、線型に等間隔な場合(例えば 0-100、100-200、200-300、…)と対数的に等間隔の場合(例えば 10-100、100-1000、1000-10000、…)がある。信号が各フィルタに入力されると、その周波数帯域以外の周波数成分は除去される(ただし、実際のフィルタは窓関数としては不完全なので、周囲の周波数帯域の成分が若干残る)。各フィルタの出力を時間と共に記録する。その記録を水平にしたものを周波数帯域の順番に積み重ねるように置くと、横軸を時間とし縦軸を周波数としたスペクトログラムが完成する。

デジタル信号では、STFTを使ってスペクトログラムを作成する。時間領域で標本化されたデータはチャンクに分けられ(チャンクは一般にオーバーラップさせる)、チャンク毎にフーリエ変換を施す。各チャンクの変換結果がスペクトログラムのある時間の全周波数成分のグラフ(スペクトル)となるので、これを垂直において時系列に並べるとスペクトログラムが完成する。

スペクトログラムからの音響生成

上述の変換処理を逆に行うこともできる。以下のプログラムはデジタル画像をスペクトログラムと解釈して音に変換できる。


ナイン・インチ・ネイルズのアルバム「イヤー・ゼロ」リーク版の最後にあるホワイトノイズ部分のスペクトログラム

この技法を電子音楽のアーティストが利用して、音楽にスペクトログラムの画像を潜ませることがある。以下に例を挙げる。

  • エイフェックス・ツインは自身の画像をスペクトログラムとして潜ませた。Windowlicker のトラック2の最後の9秒間がそれである。MP3でも認識可能だが、CDから直接スペクトログラム化したときほど鮮明ではない。同じシングルのトラック1にも螺旋の画像が潜ませてある[1]
  • ナイン・インチ・ネイルズは2007年のアルバム「イヤー・ゼロ」でこの技法を使っている。イヤー・ゼロのリリース前にリークされた "My Violent Heart" には最後に無音の部分がある。ここをスペクトログラム化すると、空から手が伸びてきている画像が出てくる。正式リリース版では、"The Warning" という曲の最後に同じ画像がある。イヤー・ゼロには他にもいくつかの画像が潜ませてある。

現代音楽では、製作途中にスペクトログラムを使う場合がある。スペクトログラム化した状態で直接周波数や時点を指定して音の強さを変更し、再度もとの音に戻す。

派生

メルスペクトログラム

メルスペクトログラム(: mel spectrogram)は周波数軸がメル尺度のスペクトログラムである。

メルスペクトログラムは(リニア)スペクトログラムにメルフィルターバンクを適用して生成されることが多く、その場合は周波数軸の次元数が小さくなる。すなわち聴覚特性に基づいた次元圧縮としても機能するため、信号処理、特にディープラーニングの前処理でしばしば用いられる[5]

メルスペクトログラムは振幅スペクトログラムを非可逆的に変換したものであるため[6]、メルスペクトログラムから振幅スペクトログラムを厳密に再生することは出来ない。振幅スペクトログラムの推定には非負最小二乗法英語版や最小二乗法+クリッピングが用いられる[7][8]

脚注

  1. ^ "A(m, k) は振幅スペクトログラム(小野順貴(2016))
  2. ^ "

「スペクトログラム」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。



スペクトログラムと同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「スペクトログラム」の関連用語

スペクトログラムのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



スペクトログラムのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのスペクトログラム (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS