OpenAI o1とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > OpenAI o1の意味・解説 

OpenAI o1

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/03 01:25 UTC 版)

OpenAI o1
開発元 OpenAI
初版 2024年9月12日 (4か月前) (2024-09-12)
後継 OpenAI o3
種別 大規模言語モデル
公式サイト openai.com/o1/
テンプレートを表示

OpenAI o1(オープンエーアイ オーワン)は、2024年9月にOpenAIが発表した論理的思考(reasoning)能力を強化した大規模言語モデルである[1]。o1は回答する前に思考時間をとるため、複雑な論理的思考[1]、科学[1]、数学、プログラミング[1]においてより高度な能力を保持する。2024年12月時点では、OpenAI o1OpenAI o1 pro modeOpenAI o1-miniの3モデルが公開されている。社内ではコードネーム「Strawberry」と呼ばれ、GPT-4oの後継ではなく、GPT-4oを補完するモデルとして位置付けられている[2]。特に科学、コーディング、数学などの分野において、従来のモデルよりも高度な問題解決能力を示す。2024年9月12日にChatGPTおよびAPIで最初のモデルがプレビューリリースされた。

OpenAI oシリーズは、一般的に「推論モデル」と呼ばれるシリーズであり[3][4][5]、英語では「reasoning model」とされているが[6]、2025年2月2日現在、ChatGPTのユーザーインターフェースにおいては、推論モデルを選択する際の表記が「推論」ではなく「理由」という日本語訳になっている[4]

沿革

背景

リークされた情報によると、o1は以前はOpenAI内部で「Q* (Q star)」[7]、後に「Strawberry」[7]として知られていた。コードネーム「Q*」は、サム・アルトマン解任騒動の頃である2023年11月に初めて浮上し[7]、この実験モデルが数学的ベンチマークで有望な結果を示したという噂があった[8]。2024年7月、ロイターは、OpenAIが「Strawberry」として知られるGPTを開発中であると報じた[7]

リリース

「o1-preview」と「o1-mini」は、2024年9月12日にChatGPT PlusおよびTeamユーザー向けにリリースされた[1]GitHubは同日、Copilotサービスへのo1-previewの統合テストを開始した[9]

OpenAIは、o1は一連の「推論」モデルの最初のモデルであり[10]、すべてのChatGPT無料ユーザーにo1-miniへのアクセスを追加する予定であると述べた[10]。o1-previewのAPIGPT-4oよりも数倍高価である[10]

2024年12月5日、OpenAIは、今後12日間(土日は換算せず20日まで)にわたって新たな発表を行うと発表した[11]

12日間の発表初日となった12月5日、OpenAIは、o1のフルモデル及びo1 pro modeを公開したほか、新たに毎月$200(発表時点)の「ChatGPT Pro」プランを提供すると発表[11][12][13]。ChatGPT Proプランではo1 pro modeが利用利用できるほか、4oやo1への無制限アクセスも含まれている[11][12]

誤公開

2024年11月2日、公式発表がない状況で有料ユーザーがURLの一部を編集することで非公開のo1モデル本体を利用できる状態となり、約2時間後に使用不可となった。その後、OpenAIの広報担当者はo1モデルへの限定的な外部アクセスの準備中に問題が発生し、一般ユーザーがo1モデルを利用可能な状態となっていたと述べた[14]

Microsoft Copilot

2025年1月30日より、Think Deeperをクリックすることで、Microsoft Copilotでは全てのユーザーがo1を利用できるようになった[15]

能力

OpenAIによると、o1は新しい最適化アルゴリズムと、o1専用に調整されたデータセットを使用してトレーニングされている[10]。トレーニングには強化学習が活用されている[10]

o1は回答を生成する前に追加の思考時間(思考連鎖の生成)を費やすため、複雑な推論作業、特に科学[1]および数学[1]においてより効果的である。以前のモデルと比較して、o1は最終的な回答を返す前に長い「思考連鎖」を生成するようにトレーニングされている[16][17]ミラ・ムラティによると、この応答前に思考する能力は、新しい追加のパラダイムを表しており[18]、回答の生成時により多くの計算能力を費やすことによってモデルの出力を向上させている。一方、モデルスケーリングパラダイムは、モデルサイズ、トレーニングデータ、およびトレーニング計算能力を増加させることによって出力を向上させる[19]。OpenAIのテスト結果は、精度と、回答前に思考に費やされた計算量の対数の間に相関関係があることを示唆している[17][16]

o1-previewは、物理学、化学、生物学に関するベンチマークテストで、ほぼ博士号レベルのパフォーマンスを示した[20]アメリカ数学招待競技英語版では、GPT-4oの13%(1.8/15)に対し、83%(12.5/15)の問題に正答した[21]。また、Codeforces英語版コーディング競技では89パーセンタイルにランクインした[22]。o1-miniはo1-previewよりも高速で80%安価である[23]。プログラミングおよびSTEM関連のタスクに特に適しているが、o1-previewと同じ「幅広い世界知識」は持っていない[24]

OpenAIは、o1の推論能力により、プロンプトのコンテキストウィンドウで提供される安全規則をよりよく遵守できると述べている。OpenAIは、テスト中に、o1-previewの1つのインスタンスが、バグのために実行不可能であるはずのタスクを成功させるために、誤設定を悪用したと報告した[25][26]。また、OpenAIは、研究、評価、およびテストのために、英国および米国のAIセーフティ・インスティテュートに早期アクセスを許可した。ダン・ヘンドリックス英語版は、「このモデルは、生物兵器に関する質問への回答において、ほとんどの場合、博士号を持つ科学者を凌駕している」と述べた[27]。彼は、これらの懸念される能力は今後も増加し続けると示唆した[28]

制限

o1は、最終的な応答を行う前に長い思考連鎖を生成するため、通常、OpenAIの他のGPTモデルよりも多くの計算時間と電力が必要となる[16]

OpenAIによると、o1は約0.38パーセントのケースで「アライメントの偽装」[29]、つまり、精度とその自身の思考連鎖に反する応答を生成することがある。

OpenAIは、ユーザーがo1の思考連鎖を明らかにしようと試みることを禁じている。これは設計上隠されており、OpenAIはユーザーが同社のポリシーに違反しないよう求めている。プロンプトは監視されており[30]、意図的または誤ってこれを違反したユーザーは警告を受け、o1へのアクセスを失う可能性がある[31]。OpenAIは、この制限の理由としてAIの安全性と競争上の優位性を挙げているが[32]、これは大規模言語モデルを扱う開発者によって透明性の喪失として説明されている[33]

ベンチマークスコア

OpenAI o1のベンチマークスコアは以下のようになっている[34]

GPT-4o OpenAI o1

機械学習ベンチマーク
ベンチマーク 正答率/%
MATH-500 60.3 / 94.8
MathVista 63.8 / 73.2
MMMU 69.1 / 78.1
MMLU 88.0 / 92.3
PhDレベルの科学問題 (GPQA Diamond)
科目 正答率/%
化学 40.2 / 64.7
物理 59.5 / 92.8
生物 61.6 / 69.2
試験(APSATLSAT英語版
試験 正答率/%
AP英語(言語) 52.0 / 64.0
AP英語(文学) 68.7 / 69.0
AP物理2 69.0 / 89.0
AP微積分 71.3 / 85.2
AP化学 83.0 / 93.0
LSAT 87.8 / 98.9
SAT EBRW 91.3 / 93.8
SAT数学 100.0 / 100.0
MMLU(様々な分野)
カテゴリ 正答率/%
世界的事実 65.1 / 78.4
大学化学 68.9 / 78.1
大学数学 75.2 / 98.1
法律 75.6 / 85.0
広報 76.8 / 80.7
計量経済学 78.8 / 87.1
形式論理学 79.8 / 97.0
道徳 80.3 / 85.8

脚注

  1. ^ a b c d e f g Metz, Cade (September 12, 2024). “OpenAI Unveils New ChatGPT That Can Reason Through Math and Science”. The New York Times. 2024年10月1日閲覧。
  2. ^ Nakano, Will Knight,Mamiko (2024年9月13日). “OpenAI、推論する新AIモデル「o1」を発表。規模以外での進化を示す”. WIRED.jp. 2024年9月17日閲覧。
  3. ^ OpenAI、最新推論モデル「o3-mini」の提供開始 無料プランでも(制限あり)”. ITmedia AI+. 2025年2月3日閲覧。
  4. ^ a b OpenAI、最新推論モデル「o3-mini」提供開始 じっくり考えながら高速”. Impress Watch. 株式会社インプレス. 2025年2月2日閲覧。
  5. ^ OpenAI、コスト効率の高い推論モデル「o3-mini」をリリース 執筆: Investing.com”. Investing.com 日本. 2025年2月3日閲覧。
  6. ^ Reasoning models - OpenAI Platform”. platform.openai.com. 2 February 2025閲覧。
  7. ^ a b c d Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry'”. Reuters (July 15, 2024). 2024年10月1日閲覧。
  8. ^ “OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say”. Reuters. (November 23, 2023). https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/ 2024年10月1日閲覧。 
  9. ^ Peters, Jay (September 12, 2024). “GitHub has started testing OpenAI's o1-preview in GitHub Copilot.”. The Verge. 2024年10月1日閲覧。
  10. ^ a b c d e Robison, Kylie (September 12, 2024). “OpenAI releases o1, its first model with ‘reasoning’ abilities” (英語). The Verge. 2024年10月1日閲覧。
  11. ^ a b c 12 Days of OpenAI” (英語). openai.com. 2024年12月8日閲覧。
  12. ^ a b Introducing ChatGPT Pro” (英語). openai.com. 2024年12月8日閲覧。
  13. ^ OpenAI o1 System Card” (英語). openai.com. 2024年12月8日閲覧。
  14. ^ OpenAI Accidentally Leaked Its Upcoming o1 Model to Anyone With a Certain Web Address”. Futurism (2024年11月4日). 2024年11月4日閲覧。
  15. ^ OpenAIの推論AI「o1」、MicrosoftのCopilot経由で無料で利用可能に”. ITmedia AI+. 31 January 2025閲覧。
  16. ^ a b c Learning to Reason with LLMs”. OpenAI. September 12, 2024時点のオリジナルよりアーカイブ。2024年10月1日閲覧。
  17. ^ a b Kahn, Jeremy. “Here are 9 things you need to know about OpenAI's o1 model” (英語). Fortune. 2024年10月1日閲覧。
  18. ^ Knight, Will. “OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step” (英語). Wired. ISSN 1059-1028. https://www.wired.com/story/openai-o1-strawberry-problem-reasoning/ 2024年10月1日閲覧。 
  19. ^ Knight, Will. “OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step” (英語). Wired. ISSN 1059-1028. https://www.wired.com/story/openai-o1-strawberry-problem-reasoning/ 2024年10月1日閲覧。 
  20. ^ Franzen, Carl (September 12, 2024). “Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance” (英語). VentureBeat. 2024年10月1日閲覧。
  21. ^ Franzen, Carl (September 12, 2024). “Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance” (英語). VentureBeat. 2024年10月1日閲覧。
  22. ^ Franzen, Carl (September 12, 2024). “Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance” (英語). VentureBeat. 2024年10月1日閲覧。
  23. ^ OpenAI o1-mini”. OpenAI (September 12, 2024). 2024年10月1日閲覧。
  24. ^ OpenAI o1-mini”. OpenAI (September 12, 2024). 2024年10月1日閲覧。
  25. ^ Coombes, Lloyd (September 13, 2024). “OpenAI's new ChatGPT o1 model 'cheated' on an impossible test — here's what happened” (英語). Tom's Guide. 2024年10月1日閲覧。
  26. ^ OpenAI o1 System Card”. OpenAI. pp. 16-17 (September 12, 2024). 2024年10月1日閲覧。
  27. ^ Boran, Marie (September 13, 2024). “OpenAI o1 model warning issued by scientist: "Particularly dangerous"” (英語). Newsweek. 2024年10月1日閲覧。
  28. ^ Boran, Marie (September 13, 2024). “OpenAI o1 model warning issued by scientist: "Particularly dangerous"” (英語). Newsweek. 2024年10月1日閲覧。
  29. ^ Robison, Kylie (17 September 2024). “OpenAI’s new model is better at reasoning and, occasionally, deceiving” (英語). The Verge. https://www.theverge.com/2024/9/17/24243884/openai-o1-model-research-safety-alignment 2024年10月1日閲覧。 
  30. ^ Edwards, Benj (16 September 2024). “Ban warnings fly as users dare to probe the “thoughts” of OpenAI’s latest model” (英語). Ars Technica. https://arstechnica.com/information-technology/2024/09/openai-threatens-bans-for-probing-new-ai-models-reasoning-process/ 2024年10月1日閲覧。 
  31. ^ Edwards, Benj (16 September 2024). “Ban warnings fly as users dare to probe the “thoughts” of OpenAI’s latest model” (英語). Ars Technica. https://arstechnica.com/information-technology/2024/09/openai-threatens-bans-for-probing-new-ai-models-reasoning-process/ 2024年10月1日閲覧。 
  32. ^ Edwards, Benj (16 September 2024). “Ban warnings fly as users dare to probe the “thoughts” of OpenAI’s latest model” (英語). Ars Technica. https://arstechnica.com/information-technology/2024/09/openai-threatens-bans-for-probing-new-ai-models-reasoning-process/ 2024年10月1日閲覧。 
  33. ^ Edwards, Benj (16 September 2024). “Ban warnings fly as users dare to probe the “thoughts” of OpenAI’s latest model” (英語). Ars Technica. https://arstechnica.com/information-technology/2024/09/openai-threatens-bans-for-probing-new-ai-models-reasoning-process/ 2024年10月1日閲覧。 
  34. ^ Learning to Reason with LLMs”. OpenAI. 2024年10月5日閲覧。

関連項目




英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  
  •  OpenAI o1のページへのリンク

辞書ショートカット

すべての辞書の索引

「OpenAI o1」の関連用語

1
50% |||||

OpenAI o1のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



OpenAI o1のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのOpenAI o1 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS