歌声合成ソフトウェア
(歌声合成 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/06/13 08:55 UTC 版)
歌声合成ソフトウェア[1][2][3](うたごえごうせいソフトウェア)は、歌詞と音符を入力することで、人間の歌声(ボーカル)に近い音声を合成するソフトウェアである[4]。歌声合成ソフトの略称で知られる[5][6][7]。シンセサイザーの一種であり、ボーカルシンセサイザー(vocal synthesizer)と呼ばれることもある[8]。
概要
歌声合成ソフトウェアは音声合成技術をボーカル用途に応用したもので、メロディと歌詞を入力することで歌声の合成ができるシンセサイザーの一種である。
特に有名な歌声合成ソフトウェアはヤマハのVOCALOIDで、動画共有サイト利用者の間で爆発的に普及した。
歴史
| 1960 | 1970 | 1980 | 1990 | 2000 | 2010 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 物理モデル | Bell Labs. "Daisy Daisy" (1961)  | 
      P.Cock "SPASM" (1990)  | 
      |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Acoustic Tube Model  | 
      より精緻な Physical Model  | 
      ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 準物理モデル | Source Filter Model  | 
      DECtalk による歌唱 (1980s)  | 
      KAE Labs "VocalWriter" (1999)  | 
      VirSyn "CANTOR" (2004)  | 
      |||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Formant Filter Model  | 
      KTH "MUSSE DIG" (1977/1984)  | 
      Diphone synthesis, EpR & SPP  | 
      Yamaha "VOCALOID" (2003)  | 
      Yamaha "VOCALOID2" (2007)  | 
      Yamaha "VOCALOID3" (2011 - )  | 
     ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| スペクトル モデル  | 
      Composite Sinusoidal Model  | 
      Yamaha "CX5M" (1984)  | 
      Corpus-based, Sinusoidal Modeling (SMS) & OLA  | 
      MW.Macon "Liricos" (1997)  | 
      NTT "Wonder Horn" (2004)  | 
      ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Time-domain Formant合成  | 
      IRCAM "CHANT" (1984)  | 
      Yamaha "PLG100-SG" (1997)  | 
      |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 音声合成や 信号処理の 出来事  | 
      LPC発明 (1970)  | 
      "Speak & Spell" (1978)  | 
      PSOLA (1986/1989)  | 
      ATR "CHATR" (1994)  | 
      大規模コーパス 利用の時代へ  | 
     ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Voder & ボコーダ (1938/1939)  | 
      フェーズ ボコーダ (1966/1978)  | 
      トラッキング フェーズ ボコーダ  | 
      フェーズ ロックド ボコーダ  | 
      Antares "Auto-Tune" (1997)  | 
      トランジェント フェーズ ボコーダ  | 
     ||||||||||||||||||||||||||||||||||||||||||||||||||||||
年表
- 1939年 - ベル研究所にて、Voderが「オールド・ラング・サイン (蛍の光)」を歌唱(発音キーとピッチペダルのリアルタイム操作)[9][10]。
 - 1961年 - ベル研究所にて、IBM 704が「デイジー・ベル」を歌唱[11][脚注 1]。
 - 1984年
 - 1997年 - PLG100-SG(ヤマハ)発売。フォルマントシンギング音源を搭載した音源ボード[14]。
 - 1999年 - VocalWriter(KAE Labs)発売[12]。最初期のMac OS用ボーカルソフト音源。
 - 2000年 - ヤマハ、のちの「VOCALOID」につながる「DAISYプロジェクト」を開始[15]。ポンペウ・ファブラ大学(バルセロナ)のMusical Technology Group との共同研究でVOCALOIDの信号処理部分が開発された[16][17]。
 - 2003年 - PlayStation 2用ソフトウェア『くまうた』(ソニー・コンピュータエンタテインメント)発売。 
    
- ゲーム内で合成音声によるキャラクター歌唱の初の事例であり、歌声合成ソフトウェアとは異なる。
 
 - 2004年
 - 2007年 - ヤマハ、「VOCALOID2」を発表。VOCALOID2を利用した初音ミク(クリプトン・フューチャー・メディア)発売。DTM用ソフトとしては異例のヒット。
 - 2008年
 - 2009年 - Sinsy(名古屋工業大学)公開。
 - 2011年 - ヤマハ、「VOCALOID3」を発表。各社がVOCALOID3製品を発売。
 - 2013年 - CeVIO Creative Studio FREE(CeVIOプロジェクト、名古屋工業大学)に歌声作成機能が実装。
 - 2014年 - ヤマハ、「VOCALOID4」を発表。各社がVOCALOID4製品を発売。
 - 2018年 
    
- ヤマハ、VOCALOID5を発表。各社がVOCALOID5製品を発売。
 - Synthesizer V(Dreamtonics)公開。
 
 - 2020年 
    
- DNN音声合成に対応したフリーソフト「NEUTRINO(SHACHI)公開。
 - Dreamtonics、DNN音声合成に対応した「Synthesizer V AI」発売。
 
 - 2021年 - CeVIOプロジェクト、DNN音声合成に対応した「CeVIO AI」発売[19]。
 
主な歌声合成ソフトウェア
- VOCALOID(ヤマハ)
 - UTAU(飴屋/菖蒲)
 - AquesTone(アクエスト)
 - V.Connect(Hal)
 - CeVIO Creative Studio / CeVIO AI(CeVIOプロジェクト)
 
- SugarCape(横江宗太)
 
- Microsoft Windows & macOS用
 
- LIQUID ADLIBS(Celemony & Ueberschall)
 - CANTOR(VirSyn)
 - Quantum Leap Symphonic Choirs(EASTWEST)
 - Synthesizer V(Dreamtonics)
 
- その他
 
- PC-6000シリーズ/PC-6600シリーズ(日本電気)
 - Yamaha CX5M(ヤマハ)
 - PLG100-SG(ヤマハ)
 - Sinsy(名古屋工業大学)
 
脚注
注釈
出典
- ^ 剣持 2012, pp. 472–476.
 - ^ 中野 & 後藤 2019, pp. 400–405.
 - ^ “About Charts”. Billboard JAPAN. 2025年6月12日閲覧。
 - ^ 剣持 2013, pp. 336–341.
 - ^ おゆひよこ、永山秀一、RAIN.C『はじめての歌声合成ソフト』ボーンデジタル、2024年2月24日、144頁。ISBN 978-4-7775-2273-6。
 - ^ “【VOCALOID・CeVIO AI・SynthesizerV】歌声合成ソフト総合【埼玉・北関東最大級】”. 島村楽器 大宮店. 島村楽器株式会社 (2023年6月18日). 2025年6月4日閲覧。
 - ^ Kaoru (2021年7月26日). “進化し続ける歌声合成ソフトの世界!”. Soundhouse. 2025年6月4日閲覧。
 - ^ “ソフト音源 - 「SYNTHESIZER V」 エンジンの製品一覧”. SONICWIRE. 2025年6月12日閲覧。
 - ^ “The Voder - Homer Dudley(Bell Labs) 1939”. YouTube. 2011年7月9日閲覧。 (歌唱デモは3分3秒から20秒間)
 - ^ M. D. Fagen, S. Millman, Amos E. Joel, G. E. Schindler (PDF). A History of Engineering and Science in the Bell System: Communications sciences(1925-1980). 5. Bell Telephone Laboratories, Inc. p. 101
 - ^ 14. "Daisy Bell(Bicycle Built for Two)," Max Mathews(1961), “National Recording Registry Adds 25”, The Library Today (Library of Congress), (2010-06-23)
 - ^ a b 剣持 2010
 - ^ CX11+FMミュージックマクロ, “Xシリーズの革新”, YAMAHA DX7/V50/SY99 FM音源講座, オリジナルの2013-01-27時点におけるアーカイブ。
 - ^ “PLG100-SG”, 音楽制作機器, ヤマハ株式会社
 - ^ 岡田, 有花 (2010年3月11日), “「VOCALOIDは人間の代用以上を目指す」 開発者語る”, ITmediaニュース
 - ^ 剣持秀紀, 大下隼人「歌声合成システムVOCALOID:現状と課題(音楽情報科学 音声言語情報処理)」『情報処理学会研究報告』第2008巻第12号、情報処理学会、2008年2月、51-56頁、
       ISSN 09196072、
       NAID 110006666040。
剣持秀紀「CGMの現在と未来:初音ミク、ニコニコ動画、ピアプロの切り拓いた世界:2.歌声合成の過去・現在・未来:「使える」歌声合成のためには」『情報処理』第53巻第5号、2012年4月、472-476頁。 - ^ Loscos 2007, Daisy(p. 5)
 - ^ “歌声合成のAquesToneを初公開”, N.Yamazaki's blog(アクエスト), (2008年8月3日)
 - ^ CeVIO AI 製品情報 | CeVIO Official Site
 
参考文献
- 剣持秀紀 (2010-03-10), “歌声合成の歴史” (PDF), 歌声合成の過去・現在・未来, p. 3
 - 剣持秀紀 (2012). “CGMの現在と未来: 初音ミク,ニコニコ動画,ピアプロの切り拓いた世界:2.歌声合成の過去・現在・未来: 「使える」歌声合成のためには”. 情報処理 53 (5): 472–476.
 - 剣持秀紀 (2013). “歌声合成ソフトウェアVOCALOIDの開発”. 電子情報通信学会 通信ソサイエティマガジン 6 (4): 336–341. doi:10.1587/bplus.6.336.
 - 中野倫靖; 後藤真孝 (2019). “歌声の合成における基盤技術——歌声合成における特徴量の制御——”. 日本音響学会誌 75 (7): 400–405.
 
- Cook, Perry R. (1999), “Toward the perfect audio morph? Singing voice synthesis and processing”, Proceedings of the Digital Audio Effects Workshop DAFx, CiteSeerx: 10.1.1.42.3295
 - Loscos, A. (2007), Spectral processing of the singing voice, Ph.D. Thesis, Pompeu Fabra University
 
関連項目
外部リンク
- 歌声合成ソフトウェアのページへのリンク