GPT-4oとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > GPT-4oの意味・解説 

GPT-4o

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/05/16 10:17 UTC 版)

Generative Pre-trained Transformer 4 Omni (GPT-4o)
開発元 OpenAI
初版 2024年5月13日 (2年前) (2024-05-13)
前身 GPT-4 Turbo
後継
種別
ライセンス プロプライエタリ
公式サイト openai.com/index/hello-gpt-4o
テンプレートを表示

GPT-4o(ジーピーティーフォーオー、Generative Pre-trained Transformer 4 Omni)は、OpenAIが開発したマルチモーダル英語版大規模言語モデル (LLM) 。2024年5月13日の配信でOpenAIのCTOであるミラ・ムラティにより発表され、同日にリリースされた[1]。同年7月18日には、速度とコスト効率に優れた軽量・小型モデルのGPT-4o mini(ジーピーティーフォーオー ミニ)も追加リリースされた。

概要

GPT-4oは、テキスト、画像、音声を入力および生成することが可能である[2]。音声入力には最短232ミリ秒で応答でき、平均320ミリ秒で人間の応答時間に近い応答が可能である[3]

GPT-4oは無料で利用できるが、一日あたり利用回数の制限がある。ChatGPT有料版「Plus」のユーザーは、回数制限が5倍に緩和される[4]APIでは、前身モデルGPT-4 Turboの半分の価格かつ2倍の速度で使用できる[1]

背景

GPT-4oはもともと、Large Model Systems Organization's (LMSYS) のチャットボットとして、「gpt2-chatbot」「im-a-good-gpt2-chatbot」「im-also-a-good-gpt2-chatbot」の3つの異なるモデルとしてひそかにリリースされていた[5]

OpenAIのCEOであるサム・アルトマンは、2024年5月7日に自身の公式Xアカウントで「im-a-good-gpt2-chatbot」とポストした。これは、これらのモデルがA/Bテストされている新しいモデルであることの確認として解釈された[6]

能力

GPT-4oは、2023年10月までの学習データを保有している[7][8]。12万8,000 (128k) トークンのコンテキスト長に対応し[7]、2,048トークンまでを出力できる[8]

GPT-4oは、音声、多言語、画像認識ベンチマークで最先端の結果を達成し、また音声認識と翻訳に関する分野で新記録を樹立した[9][10]。また、GPT-4oは、Massive Multitask Language Understanding(MMLU)ベンチマークで88.7というスコアを取得した。GPT-4は86.5である[11]

GPT-3.5やGPT-4は、音声認識をする際に異なるモデルを使用している一方、GPT-4oは言語モデルとしてvoice-to-voiceに対応しているため、応答をより速く生成することができる[11]。しかし、サム・アルトマンは2024年5月15日に、GPT-4oのこの機能はまだChatGPTに搭載されていないため、従来の方法が使用されている可能性があるとした[12]

GPT-4oは、50以上の言語に多言語対応しており[1]、これは世界の言語話者の97%以上に及ぶとOpenAIは述べている[13]。ミラ・ムラティは、2024年5月13日のOpenAIの配信において、モデルにイタリア語を伝え、それを英語とイタリア語に翻訳することで、モデルの多言語能力を実証していた。

さらに、GPT-4oの新しいトークナイザーは、特にラテン文字に基づかない言語などに使用するトークンが少ないという特徴がある。そのため、それらの言語を使用するときのコストを抑えることができる[11]

2024年5月現在、カリフォルニア大学バークレー校のLarge Model Systems Organization (LMSYS) イロレーティングベンチマークに含まれている[14]

モデル一覧

  • GPT-4o mini:2024年7月18日リリース。速度とコストを両立した軽量小型モデル。
  • GPT-4o:2024年5月13日リリース。テキスト、音声、画像をリアルタイムで処理するフラッグシップモデル。

音声に関する論争

OpenAIは、GPT-4oの音声として「Breeze、Cove、Ember、Juniper、Sky」の4種を提供した。GPT-4oのリリース後、このうち「Sky」の音声が、 女優のスカーレット・ヨハンソンの声に似ているとされた。2024年5月14日付の『エンターテインメント・ウィークリー』誌は、この類似は意図的なものかを問う記事を掲載した[15]。同年5月18日には、ヨハンソンの夫であるコリン・ジョスト英語版が『サタデー・ナイト・ライブ』で、そのことに関するジョークを言った[16]。同年5月20日、OpenAIは「Sky」を無効にし「ChatGPT、特にSkyの声をどのように学習したかについて質問をもらった。私たちはそれらに対処しながら、Skyの使用を一時停止している」と声明を出した[17]

スカーレット・ヨハンソンは、2013年スパイク・ジョーンズSF映画her/世界でひとつの彼女』に主演し、人工知能OSである「サマンサ」の役を演じた経緯があった。

2024年5月13日、GPT-4oのリリース前のプロモーションの一環として、サム・アルトマンは自身の公式Xアカウントで「Her」とツイートしていた[18][19]

OpenAIは、それぞれの声は雇われた声優によるものだと主張し、具体的には「Skyの声は、スカーレット・ヨハンソンの真似ではなく、別のプロの声優が本人の自然な話し声で作ったものだ」と主張した[17]。OpenAIはすでに2023年9月、ChatGPTアシスタントの近々登場する新しい会話バージョンは、スカーレット・ヨハンソンに似せることを意図したものではないと主張していた。

OpenAIのCTOのミラ・ムラティは、その声については分からないので、実際にスカーレット・ヨハンソンの声を聞きに行かなければならなかったと述べた。OpenAIはさらに、ヨハンソンに連絡する前に声優を募集したと主張した[20][19]

この事件に対して人々は、ヨハンソンが以前、マーベル映画『ブラック・ウィドウ』のストリーミング配信をめぐる契約違反でウォルト・ディズニー社を訴えて和解した経緯との類似点を指摘した。この和解でヨハンソンは4,000万ドルほどを得たと推測されている[21][22]

また、2024年5月21日には『ワシントンポスト』のShira Ovide記者が、テクノロジー企業による「most bone-headed self-owns(最も間抜けな自己所有)」リストを発表し、その中で、OpenAIがGPT-4oにおいて、ヨハンソンに似た声を彼女の不同意にもかかわらず採用し、その後に類似点を否定した決定を6位にランクインさせた[20]5月22日、『ポリティコ』のデレク・ロバートソンは「massive backlash(大規模な反発)」について書き、「世界で最も有名な映画スターの一人の声を盗用することは、 AIへの過度の依存についての警告となるこの映画[注釈 1]に関連しているが、すぐに世論をサム・アルトマン氏の主張に引き戻すのに役立つ可能性は低い」と結論づけた[23]

脚注

注釈

  1. SF映画『her/世界でひとつの彼女』を指す。

出典

  1. 1 2 3 Wiggers (2024年5月13日). OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (英語). TechCrunch. 2024年5月13日閲覧。
  2. Claburn. OpenAI unveils GPT-4o, a fresh multimodal AI flagship model (英語). The Register. 2024年5月18日閲覧。
  3. Hello GPT-4”. OpenAI. 2024年6月8日閲覧。
  4. Field (2024年5月13日). OpenAI launches new AI model GPT-4o and desktop version of ChatGPT (英語). CNBC. 2024年5月14日閲覧。
  5. Edwards (2024年5月13日). Before launching, GPT-4o broke records on chatbot leaderboard under a secret name (英語). Ars Technica. 2024年5月17日閲覧。
  6. Zeff (2024年5月7日). Powerful New Chatbot Mysteriously Returns in the Middle of the Night (英語). Gizmodo. 2024年5月17日閲覧。
  7. 1 2 Models - OpenAI API”. OpenAI. 2024年5月17日閲覧。
  8. 1 2 Conway (2024年5月13日). What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free (英語). XDA Developers. 2024年5月17日閲覧。
  9. van Rijmenam (2024年5月13日). OpenAI Launched GPT-4o: The Future of AI Interactions Is Here”. The Digital Speaker. 2024年5月17日閲覧。
  10. Daws (2024年5月14日). GPT-4o delivers human-like AI interaction with text, audio, and vision integration (英語). AI News. 2024年5月18日閲覧。
  11. 1 2 3 Hello GPT-4o”. OpenAI. 2024年6月7日閲覧。
  12. “OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman”. The Times of India. (2024年5月16日). ISSN 0971-8257 2024年5月18日閲覧。
  13. Edwards (2024年5月13日). Major ChatGPT-4o update allows audio-video talks with an “emotional” AI chatbot (英語). Ars Technica. 2024年5月17日閲覧。
  14. Franzen (2024年5月13日). OpenAI announces new free model GPT-4o and ChatGPT for desktop (英語). VentureBeat. 2024年5月18日閲覧。
  15. Stenzel (2024年5月14日). ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose? (英語). Entertainment Weekly. 2024年5月21日閲覧。
  16. Caruso (2024年5月20日). Scarlett Johansson Says She Was ‘Shocked, Angered and in Disbelief’ After Hearing ChatGPT Voice That Sounds Like Her — Read Statement (英語). TVLine. 2024年5月21日閲覧。
  17. 1 2 How the voices for ChatGPT were chosen”. OpenAI (2024年5月19日). 2024年6月7日閲覧。
  18. her”. X (formerly Twitter) (2024年5月13日). 2024年5月21日閲覧。
  19. 1 2 Allyn, Bobby (2024年5月20日). “Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice”. NPR
  20. 1 2 Ovide, Shira (2024年5月30日). “Perspective | Exactly how stupid was what OpenAI did to Scarlett Johansson?”. Washington Post
  21. Scarlett Johansson took on Disney. Now she’s battling OpenAI over a ChatGPT voice that sounds like hers (英語). Yahoo Finance (2024年5月21日). 2024年5月21日閲覧。
  22. Pulver, Andrew (2021年10月1日). “Scarlett Johansson settles Black Widow lawsuit with Disney” (英語). The Guardian. ISSN 0261-3077 2024年5月21日閲覧。
  23. Sam Altman’s Scarlett Johansson Blunder Just Made AI a Harder Sell in DC”. POLITICO (2024年5月22日). 2024年6月7日閲覧。

関連項目




英和和英テキスト翻訳

英語⇒日本語日本語⇒英語
  •  GPT-4oのページへのリンク

辞書ショートカット

すべての辞書の索引

「GPT-4o」の関連用語

1
14% |||||

GPT-4oのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



GPT-4oのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのGPT-4o (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2026 GRAS Group, Inc.RSS