GSLM
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/09/22 07:14 UTC 版)
Generative Spoken Language Model (GSLM) は音声を入力とした言語モデルである。文字列を入力として一切利用しない。音声は言語情報以外にパラ言語情報・非言語情報を含んでいるため、音声を入力とするGSLMが獲得する表現にはこれらの情報もコードされていると期待される。
※この「GSLM」の解説は、「言語モデル」の解説の一部です。
「GSLM」を含む「言語モデル」の記事については、「言語モデル」の概要を参照ください。
- GSLMのページへのリンク