音声分析とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > 音声分析の意味・解説 

音声分析

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/20 11:43 UTC 版)

音声分析 おんせいぶんせき: speech analysis)は音声特徴量へ変換・表現することである[1]

概要

音声とはヒトの喉から発せられた振動である。最も単純な表現として音声は波、すなわち振幅の時間変動で表される。一方で波には様々な表現が存在する。例えばフーリエ変換を介して周波数表現でも等価に表現できるし、STFTによりスペクトログラムとしても表現できる。このように波である音声を分析し異なる表現へ変換することを音声分析という。

音声分析により得られる音響特徴量にはスペクトログラム、基本周波数などが挙げられる。これらの音響特徴量は音声認識音声合成の入力として利用される。

音響特徴量

音響特徴量 おんきょうとくちょうりょう: acoustic feature, speech representation)は音声分析で得られる特徴量である。

音響特徴量は専門家の手による特徴量エンジニアリングで考案されたり、機械学習を利用した表現学習によって得られる。特徴量の良さはその用途により異なる。以下は音響特徴量の例である。

非周期性指標

非周期性指標 ひしゅうきせいしひょう: aperiodicity)は音響信号の各周波数における非調波成分の割合である[2]。有声音であれば声のかすれ具合に相当する[3]

分類

音声分析はアプローチによって様々に分類できる。

短時間分析

短時間分析 たんじかんぶんせき: short-term analysis)は音声を短い音声断片へ区分けして扱う分析の総称である[4] フレーム分析 フレームぶんせき: frame analysis)とも。

音声とくに言語音はしばしば準定常性をもつ、すなわち短時間では定常で長時間では変動する[4]。短時間と長時間の特性を同時に分析するには、長い音声を短時間に区分けして各区画の特性を調べかつその変遷に着目すればよい[4]。これが短時間分析である。音声の言語音的側面を調べる際は短時間分析が多様される。一例として、短時間フーリエ変換等の時間周波数解析PSOLAの分析段階が挙げられる。

分析窓

分析窓 ぶんせきまど: analysis window)は音声から短時間区間を切り出す窓関数である[5]

この項目は、物理学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めていますプロジェクト:物理学Portal:物理学)。



このページでは「ウィキペディア」から音声分析を検索した結果を表示しています。
Weblioに収録されているすべての辞書から音声分析を検索する場合は、下記のリンクをクリックしてください。
 全ての辞書から音声分析 を検索

英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「音声分析」の関連用語

音声分析のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



音声分析のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの音声分析 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS