Text-to-Imageモデルとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > Text-to-Imageモデルの意味・解説 

Text-to-Imageモデル

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/06/08 07:34 UTC 版)

an astronaut riding a horse, by Hiroshigeというプロンプトから出力された画像。2022年に初めて公開されたStable Diffusion 3.5によって生成されたものである。

Text-to-Imageモデル(テキストトゥイメージモデル)は、入力された自然言語プロンプトを読み取り、その内容に一致する画像を生成する機械学習モデル。

Text-to-Imageモデルは、AIブームの黎明期である2010年代半ばの、ディープニューラルネットワークの進歩を背景に開発が始まった。2022年には、DALL-E 2Stable DiffusionMidjourneyといった最先端のText-to-Imageモデルの出力結果は、実際の写真や人間が描いたアートの品質に肉薄していると考えられるようになった。

最も効果的なモデルは一般的に、ウェブスクレイピングされた大量の画像とテキストデータで学習されている[1]

参考文献

関連項目




英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  
  •  Text-to-Imageモデルのページへのリンク

辞書ショートカット

すべての辞書の索引

Text-to-Imageモデルのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Text-to-Imageモデルのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのText-to-Imageモデル (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS