音声分析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/20 11:43 UTC 版)
概要
音声とはヒトの喉から発せられた振動である。最も単純な表現として音声は波、すなわち振幅の時間変動で表される。一方で波には様々な表現が存在する。例えばフーリエ変換を介して周波数表現でも等価に表現できるし、STFTによりスペクトログラムとしても表現できる。このように波である音声を分析し異なる表現へ変換することを音声分析という。
音声分析により得られる音響特徴量にはスペクトログラム、基本周波数などが挙げられる。これらの音響特徴量は音声認識や音声合成の入力として利用される。
音響特徴量
音響特徴量は専門家の手による特徴量エンジニアリングで考案されたり、機械学習を利用した表現学習によって得られる。特徴量の良さはその用途により異なる。以下は音響特徴量の例である。
非周期性指標
分類
音声分析はアプローチによって様々に分類できる。
短時間分析
音声とくに言語音はしばしば準定常性をもつ、すなわち短時間では定常で長時間では変動する[4]。短時間と長時間の特性を同時に分析するには、長い音声を短時間に区分けして各区画の特性を調べかつその変遷に着目すればよい[4]。これが短時間分析である。音声の言語音的側面を調べる際は短時間分析が多様される。一例として、短時間フーリエ変換等の時間周波数解析、PSOLAの分析段階が挙げられる。
分析窓
この項目は、物理学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(プロジェクト:物理学/Portal:物理学)。
「音声分析」の例文・使い方・用例・文例
- 音声分析
- 音声分析のページへのリンク