GPT Image
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/04/17 07:33 UTC 版)
|
GPT Image 1.5によって生成された水彩画風の画像
|
|
| 開発元 | OpenAI |
|---|---|
| 初版 | 2025年3月25日 |
| 最新版 |
1.5 / 2025年12月16日
|
| 前身 | DALL-E |
| 種別 | 画像生成および画像編集 |
| 公式サイト | ChatGPT Images |
GPT Imageは、OpenAIによって開発された画像生成および編集モデルのシリーズである。GPTファミリーのテキストから画像を生成するモデルの一種であり、ディープラーニングの手法を用いて、自然言語による記述や既存の画像からデジタル画像を精密に生成する。 DALL-Eの後継として、GPT ImageはChatGPTにネイティブに組み込まれており、APIを通じても利用可能である。2025年3月のリリース時、GPT Imageはソーシャルメディア上で、特にスタジオジブリ風の画像を生成する機能によりバイラル的な人気を集めた。また、GPT ImageはMicrosoft CopilotやApple Intelligenceでも利用可能である。
歴史
GPT Imageの最初のモデルは、2025年3月25日のブログ投稿で「GPT-4o画像生成」としてOpenAIによって公開され、画像を生成するためにGPT-4oモデルに基づいて開発された[1]。当初は有料ユーザーのみに提供され、需要の高さから無料ユーザーへの展開は遅れた[2]。その後、サム・アルトマンが使用レベルの高さからGPUが「溶けている」と発言し、機能の使用は制限された[3]。OpenAIは後に、最初の1週間で世界中の1億3000万人以上のユーザーが7億枚以上の画像を作成したと述べている[4]。このモデルはGPT Image 1(gpt-image-1)と名付けられ、4月23日にAPIに導入された。費用対効果の高いバージョンであるGPT Image 1 Mini(gpt-image-1-mini)は、OpenAI DevDay 2025と同じ10月6日にリリースされ、APIでのコストはGPT Image 1よりも80%安価であった[5][6]。
GPT Image 1.5(gpt-image-1.5)という名前の新しいモデルは12月16日に導入され、「ChatGPT Images」として世界中のすべてのユーザーに展開されるとともに、API経由でも即座に利用可能になった[7]。OpenAIは、新しいモデルが詳細を維持しながら正確な編集を行うことができ、最大4倍の速度で画像を生成すると主張している。APIでの画像の入力と出力は、GPT Image 1と比較してGPT Image 1.5の方が20%安価である[8]。
機能
DALL-E 2およびDALL-E 3モデルなどの以前の拡散モデルとは異なり、GPT Imageモデルは自己回帰的であり、画像から画像への変換、高度なフォトリアリズム、詳細な指示の遵守など、いくつかの新機能を備えている[9]。GPT Imageは、1024×1024(1:1、正方形)、1536×1024(3:2、横長)、1024×1536(2:3、縦長)ピクセルの3つのサイズで画像を生成できる[10]。
GPT Image 1.5は、以前のモデルで見られた不自然なトリミングや暖色系への偏りを改善しているが[1]、特定のいくつかのアートスタイルの生成においては後退している。さらに、複数の顔や、中国語、アラビア語、ヘブライ語などの一部の言語に関する弱点は、最新モデルでも依然として残っている[7]。
評価
テクノロジー評論家は概ね、GPT Imageを画像生成における重要な進歩と見なしている。TechRadarは、GPT Image 1が写実的な風景から様式化されたイラストまで幅広い出力を生成できる目覚ましいパフォーマンスを提供していると強調し、以前のツールと比較してテキストのレンダリングとマルチモーダル統合において顕著な改善が見られると指摘した。しかし、Heise Onlineは、GPT Image 1が過剰なシャープニングによるアーティファクト、暖色系への偏り、人間の姿勢や物体の重なりをレンダリングする際の一般的な間違いなどの技術的弱点を示しており、全体的なパフォーマンスは強力であるものの、出力のリアリズムには限界があることを示唆していると報じた[11]。
文化的影響
2025年3月のGPT Image 1の公開時、スタジオジブリ映画のスタイルで再現された写真がバイラル的に拡散された[12]。サム・アルトマンは、自身のTwitterのプロフィール画像をスタジオジブリにインスパイアされたものに変更することで、このトレンドを認識した[13][14]。ホワイトハウスの公式Twitterアカウントは、フェンタニル密売の有罪判決を受けて以前に追放された移民であるバージニア・バソラ=ゴンザレスが移民局によって逮捕されたことを嘲笑するジブリ風の画像を投稿し、移民局の職員が手錠をかけている際に彼女が泣いている様子を描いた[15][16][17]。北米の配給会社であるGKIDSはプレスリリースでこのトレンドに反応し、フィルターの使用を、同時期に行われた1997年のスタジオジブリ映画『もののけ姫』のIMAX再上映と比較した[18]。
関連項目
外部リンク
- ChatGPT Images
- GPT Image 1.5 Model
- Gpt-image-1.5 Prompting Guide
- 4o ImageGen - GPT Image 1の公式カスタムGPT
脚注
- 1 2 “Introducing 4o Image Generation”. OpenAI (2025年3月25日). 2025年10月5日時点のオリジナルよりアーカイブ。2026年4月17日閲覧。
- ↑ Roth, Emma (2025年3月26日). “ChatGPT's new image generator is delayed for free users”. The Verge 2026年4月17日閲覧。
- ↑ Welch, Chris (2025年3月27日). “OpenAI says "our GPUs are melting" as it limits ChatGPT image generation requests”. The Verge 2026年4月17日閲覧。
- ↑ “Introducing our latest image generation model in the API”. OpenAI (2025年4月23日). 2026年4月17日閲覧。
- ↑ “OpenAI DevDay 2025”. OpenAI (2025年10月6日). 2025年10月21日時点のオリジナルよりアーカイブ。2026年4月17日閲覧。
- ↑ Matthias Bastian (2025年10月6日). “Developers can now build and deploy both apps and agents directly on the ChatGPT platform”. The Decoder. 2025年10月7日時点のオリジナルよりアーカイブ。2026年4月17日閲覧。
- 1 2 “The new ChatGPT Images is here”. OpenAI (2025年12月16日). 2025年12月17日時点のオリジナルよりアーカイブ。2026年4月17日閲覧。
- ↑ “Pricing”. OpenAI Platform. OpenAI. 2026年4月17日閲覧。
- ↑ Addendum to GPT-4o System Card: Native image generation (PDF) (Report). OpenAI. 2025年3月25日. 2026年4月17日閲覧.
- ↑ “Image generation”. OpenAI Platform. OpenAI. 2026年4月17日閲覧。
- ↑ Volker Zota (2025年4月8日). “Image generator from GPT-4o: what is probably behind the technical breakthrough”. Heise Online. 2025年12月17日時点のオリジナルよりアーカイブ。2026年4月17日閲覧。
- ↑ Spangler, Todd (2025年3月26日). “OpenAI CEO Responds to ChatGPT Users Creating Studio Ghibli-Style AI Images”. Variety 2026年4月17日閲覧。
- ↑ Choudhary, Govind (2025年3月27日). “OpenAI CEO Sam Altman reacts as AI turns him into a Studio Ghibli Character” (英語). Mint 2026年4月17日閲覧。
- ↑ Notopoulos, Katie (2025年3月27日). “Sam Altman did a good tweet”. Business Insider 2026年4月17日閲覧。
- ↑ O'Brien, Matt; Parvini, Sarah (2025年3月27日). “ChatGPT's viral Studio Ghibli-style images highlight AI copyright concerns” (英語). AP News 2026年4月17日閲覧。
- ↑ Bio, Demian (2025年3月27日). “White House Mocks Migrant With Criminal Record Who Cried After Being Arrested” (英語). Latin Times 2026年4月17日閲覧。
- ↑ Vera, Kelby (2025年3月27日). “White House Posts Ghoulish AI Cartoon Showing Woman's Deportation” (英語). HuffPost 2026年4月17日閲覧。
- ↑ Tangcay, Jazz (2025年3月28日). “Studio Ghibli Distributor Champions 'Princess Mononoke' Box Office at 'A Time When Technology Tries to Replicate Humanity'”. Variety 2026年4月17日閲覧。
- GPT Imageのページへのリンク