ソース・フィルタモデルとは - わかりやすく解説 Weblio辞書

ウィキペディア

索引トップ用語の索引ランキングカテゴリー

ソース・フィルタモデル

(Source-filter model から転送)

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2020/01/17 14:18 UTC 版)

ナビゲーションに移動検索に移動

この記事のほとんどまたは全てが唯一の出典にのみ基づいています。
他の出典の追加も行い、記事の正確性・中立性・信頼性の向上にご協力ください。（2020年1月）

ソース・フィルタモデル (英: Source-filter model) とは、喉で声が作られる過程を、ソースつまり音源 (声門など) と線形音響フィルタ (声道および放射特性) で近似する数理モデルである。

音声合成や音声分析に使用される。このモデルは「ソースとフィルタの独立性」を仮定しており、この仮定を強調するならば「独立ソース・フィルタモデル」(independent source-filter model)^[1]と呼ぶべきである。

このモデルは比較的シンプルで応用例が多数ある。程度の差こそあれ、異なる音素はその音源とスペクトル形状の特性によって区別できる。発声された音 (例: 母音) は、(少なくとも) 一つの音源 —— (たいていは) 声門の周期的励起 —— を持ち、それは時間領域ではインパルス列、周波数領域ではハーモニクスとして近似でき、また舌の位置や唇の突き出し具合に依存したフィルタ (調音) を持つ。他方、摩擦音は (少なくとも) 一つの音源を持つ —— 口腔を狭める事 (constriction) で生成される乱流騒音 (例: 正書法 (orthographically) で"s"や"f"で表現される音) である。有声摩擦音 ("z"や"v") は二つの音源を持つ —— 一つは声門で、もう一つは声門上部のくびれである。

ソース・フィルタモデルは線形予測 (linear prediction) と関連している。モデルの開発は、その大部分が Gunnar Fant（英語版）の初期の研究に拠っている —— もちろん他の人々、特に Ken Stevens（英語版）も音声の音響分析や音声合成の基礎となるモデルに潜在的には寄与しているが。

ソース・フィルタモデルでは、音源または励起信号は、有声音については周期的インパルス列で、無声音についてはホワイトノイズで、しばしばモデル化される。声道フィルタは、最も単純な場合には全極フィルタ (all-pole filter) で近似され、その係数は再生される音声信号の平均二乗誤差を最小とする線形予測により得られる。励起信号をフィルタの伝達関数と畳み込む事で、合成音声が得られる。

出典

[ヘルプ]

^ Martin Rothenberg (2008), “The Source-Filter Model Lives (if you are careful)” (PDF), Voice Foundation 37th Annual Symposium, May 28 to June 1, 2008

関連項目

この項目は、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（PJ:コンピュータ/P:コンピュータ）。

この項目は、言語学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（ウィキポータル言語学）。

音声合成

モデル / 手法

エンジン

商　用	AquesTalk CereProc（英語版） IVONA（英語版） Microsoft text-to-speech voices（英語版） PlainTalk（英語版）
フリー	eSpeak（英語版） Gnuspeech（英語版） Festival Speech Synthesis System（英語版）
非OSS	MBROLA（英語版）

システム / API

商　用	Microsoft Speech API Microsoft Speech Server（英語版） Talk It!（英語版）
フリー	FreeTTS（英語版）

ハードウェア

歴史的	DECtalk（英語版） Pattern playback（英語版） The Voder（英語版） Wolfgang von Kempelen's speaking machine（英語版）
ＬＳＩ	GI SP0256（英語版） TI LPC Speech Chips（英語版）
娯　楽	Currah（英語版） Echo 2（英語版） Phasor（英語版） Intellivoice（英語版） Speak & Spell（英語版） PC-6000シリーズ PC-6600シリーズ Yamaha CX5M（英語版）

応用ソフトウェア

商　用	AOLbyPhone（英語版） DialogOS（英語版） Dr. Sbaitso（英語版） Microsoft Agent（英語版） Microsoft Narrator（英語版） Voice font（英語版）

アクセシビリティ

RIAS（英語版）
Silent speech interface（英語版）
Speech-generating device（英語版）
Spoken Web（英語版）
TuVox（英語版）

スクリーン　
リーダー
(リスト)

商　用	JAWS PC Talker（） VoiceOver
フリー	BRLTTY（） Gnopernicus（英語版） GR for UNIX（） NonVisual Desktop Access Orca Thunder（英語版）
ハード	簡単ケータイらくらくホン

Self-voicing

商　用	WordQ+SpeakQ（英語版）
フリー	Emacspeak（英語版）

音声ブラウザ

商　用	aiBrowser ホームページリーダー Spoken Web（英語版）

ブラウザ拡張

フリー	Fire Vox（英語版） Text to Voice（英語版）

サイト拡張

商　用	BrowseAloud（英語版） Readspeaker（英語版）

ボーカルシンセ

商　用	Cantor（英語版） VOCALOID VOICEROID くまうた
フリー	AquesTone Flinger（英語版）ディレイラマ
シェア	UTAU（重音テト）
非OSS	MBROLA（英語版）
ハード	DECtalk（英語版） PC-6000シリーズ PC-6600シリーズ Yamaha CX5-M（英語版）
応　用	ぼかりす
サイト	Sinsy コエラボ

サービス・サイト

Odiogo（英語版）
Quack.com（英語版）

プロトコル

開発者・研究者

Catherine Browman（英語版）
Franklin Seaney Cooper（英語版）
Gunnar Fant（英語版）
Haskins Laboratories（英語版）
ヴォルフガング・フォン・ケンペレン
Ignatius Mattingly（英語版）
Philip Rubin（英語版）
CereProc（英語版）
IVONA（英語版）
VoiceWeb（英語版）
ヤマハ

ソース・フィルタモデルとは？わかりやすく解説