Transformer (機械学習モデル)とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > Transformer (機械学習モデル)の意味・解説 

Transformer (機械学習モデル)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/02 08:41 UTC 版)

Transformer(トランスフォーマー)は、2017年6月12日にGoogleの研究者等が発表した深層学習モデルであり、主に自然言語処理 (NLP)の分野で使用される[1]

自然言語などの時系列データを扱って翻訳やテキスト要約などのタスクを行うべく設計されているのは回帰型ニューラルネットワーク (RNN)と同様だが、Transformer の場合、時系列データを逐次処理する必要がないという特徴がある。たとえば、入力データが自然言語の文である場合、文頭から文末までの順に処理する必要がない。このため、Transformer では 回帰型ニューラルネットワークよりもはるかに多くの並列化が可能になり、トレーニング時間が短縮される[1]

その導入以来、Transformer モデルは自然言語処理の多くの問題に取り組む上で広く選択されており、 Long Short-term Memory(LSTM)などの古い回帰型ニューラルネットワークモデルに取って代わった。Transformer モデルはトレーニング中の並列化を容易にするため、より大きなデータセットでのトレーニングを可能にした。このことが、 BERT (Bidirectional Encoder Representations from Transformers)や GPT (Generative Pre-trained Transformers)などの事前トレーニング済みシステムの開発につながった。これらは、巨大な一般言語データセットでトレーニングされており、特定の言語タスクにファインチューニングできる[2][3]

背景

トランスフォーマー登場以前には、自然言語処理の分野で注意機構(アテンション)を回帰型ニューラルネットワークモデルに追加するモデルが広く採用されていた。

注意機構

注意機構: attention mechanism)またはアテンション: Attention)は系列信号の重み付き統合である。

アテンションの基本は次のモデル式で表される。




英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  
  •  Transformer (機械学習モデル)のページへのリンク

辞書ショートカット

すべての辞書の索引

「Transformer (機械学習モデル)」の関連用語

Transformer (機械学習モデル)のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Transformer (機械学習モデル)のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのTransformer (機械学習モデル) (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS