共同研究の成果
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/08/03 22:20 UTC 版)
「DAISYプロジェクト」の記事における「共同研究の成果」の解説
Loscos (2007)によれば、MTGとヤマハの共同研究で開発された信号処理手法は、2001〜2003年の三つの論文 Bonada & Loscos (2003)、Bonada et al. (2003)、Bonada et al. (2001)で発表された。この研究ではフレームベースの周波数領域テクニック(diphone等のフレーム単位に区切られた音声素片を周波数領域で処理する手法)を使って、与えられた楽譜と歌詞に従って歌声データベース上の音声素片を移調/時間伸縮/連結して歌声を合成するシステムが示された。 この研究の音声モデルは、スペクトル・モデルの1つ SMS手法による「調波+残余」表現をベースに、準物理モデルの1つソース・フィルタモデルの拡張として新規開発された Excitation plus Resonances(EpR)音声モデルによる「励起+共鳴」表現を組合せて表現される。なおモデルと元波形の相違は、分析時に差分スペクトル形状として保存し、再合成時に加算して音質変化を抑制する。 歌声合成の基盤として、phase-locked vocoderに基づくフレームベースのスペクトル分析/合成手法Spectral peak processing(SPP)を使ったサンプル変形手法 —— 時間スケーリング、スペクトルの非線形スケーリングによるピッチ変換、位相補正、スペクトル包絡のピーク強度調整(equalization)による音色調整 —— が開発された。また素片接続に関しては、素片フレーム間に遷移フレームを挿入し、上記サンプル変形手法を使って位相接続やスペクトル形状接続(いわゆるスペクトル包絡補間)を行う手法が開発された。 なお製品版VOCALOIDで実際に採用された技術については、たとえば剣持 & 大下 (2008)に概略説明がある。
※この「共同研究の成果」の解説は、「DAISYプロジェクト」の解説の一部です。
「共同研究の成果」を含む「DAISYプロジェクト」の記事については、「DAISYプロジェクト」の概要を参照ください。
- 共同研究の成果のページへのリンク