動的時間伸縮法
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/24 03:55 UTC 版)
動的時間伸縮法(Dynamic time warping、DTW)は初期の音声認識手法であるが、隠れマルコフモデルに基づく手法が一般化したため、使われなくなった。時間または早さの異なる2つの信号シーケンスの間の類似度を測るアルゴリズムである。例えば、人間の歩行のパターンは、素早く歩いても、ゆっくり歩いても、さらには歩行の画像を早送りしてもスロー再生しても一定のパターンが存在する。DTW は音声だけでなく動画などの任意の時系列のデータに適用可能である。音声認識においては、発声速度がどうであっても一定のパターンを検出するために使われていた。従って、比較のための標準パターンが必要であり、認識できる語彙は限定される。
※この「動的時間伸縮法」の解説は、「音声認識」の解説の一部です。
「動的時間伸縮法」を含む「音声認識」の記事については、「音声認識」の概要を参照ください。
- 動的時間伸縮法のページへのリンク