音声分析とは？わかりやすく解説

音声分析 （おんせいぶんせき、（英: speech analysis）は音声を特徴量へ変換・表現することである^[1]。

概要

音声とはヒトの喉から発せられた振動である。最も単純な表現として音声は波、すなわち振幅の時間変動で表される。一方で波には様々な表現が存在する。例えばフーリエ変換を介して周波数表現でも等価に表現できるし、STFTによりスペクトログラムとしても表現できる。このように波である音声を分析し異なる表現へ変換することを音声分析という。

音声分析により得られる音響特徴量にはスペクトログラム、基本周波数などが挙げられる。これらの音響特徴量は音声認識や音声合成の入力として利用される。

音響特徴量

音響特徴量 （おんきょうとくちょうりょう、（英: acoustic feature, speech representation）は音声分析で得られる特徴量である。

音響特徴量は専門家の手による特徴量エンジニアリングで考案されたり、機械学習を利用した表現学習によって得られる。特徴量の良さはその用途により異なる。以下は音響特徴量の例である。

非周期性指標

非周期性指標 （ひしゅうきせいしひょう、（英: aperiodicity）は音響信号の各周波数における非調波成分の割合である^[2]。有声音であれば声のかすれ具合に相当する^[3]。

分類

音声分析はアプローチによって様々に分類できる。

短時間分析

短時間分析 （たんじかんぶんせき、（英: short-term analysis）は音声を短い音声断片へ区分けして扱う分析の総称である^[4]。 フレーム分析 （フレームぶんせき、（英: frame analysis）とも。

音声とくに言語音はしばしば準定常性をもつ、すなわち短時間では定常で長時間では変動する^[4]。短時間と長時間の特性を同時に分析するには、長い音声を短時間に区分けして各区画の特性を調べかつその変遷に着目すればよい^[4]。これが短時間分析である。音声の言語音的側面を調べる際は短時間分析が多様される。一例として、短時間フーリエ変換等の時間周波数解析、PSOLAの分析段階が挙げられる。

分析窓

分析窓 （ぶんせきまど、（英: analysis window）は音声から短時間区間を切り出す窓関数である^[5]。 $w_{a}(t)$

この項目は、物理学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（プロジェクト:物理学／Portal:物理学）。

[1]

[2]

[3]

[4]

[5]


	All text is available under the terms of the GNU Free Documentation License. この記事は、ウィキペディアの音声分析 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
TANAKA Corpus	Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います： Creative Commons Attribution (CC-BY) 2.0 France.
京大-NICT 日英中基本文データ	この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
	Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
	Copyright © Benesse Holdings, Inc. All rights reserved.
	Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
	日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved. WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
	Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved. 「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
	This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

音声分析とは？わかりやすく解説

音声分析

概要

音響特徴量

非周期性指標

分類

短時間分析

分析窓

「音声分析」の例文・使い方・用例・文例

「音声分析」の関連用語

音声分析とは？ わかりやすく解説

音声分析

概要

音響特徴量

非周期性指標

分類

短時間分析

分析窓

「音声分析」の例文・使い方・用例・文例

「音声分析」の関連用語

音声分析とは？わかりやすく解説