Arena (AIプラットフォーム)
(LMArena から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/02/15 01:16 UTC 版)
| |
|
| URL | arena |
|---|---|
| タイプ | 人工知能 |
| 本国 | |
| 設立者 |
|
| 登録 | オプション |
| 開始 | 2023年4月24日 |
Arena(アリーナ、旧:Chatbot Arena(チャットボット アリーナ)・LMArena(エルエムアリーナ))は、大規模言語モデル(LLM)を評価する公開型ウェブプラットフォーム。ユーザーがプロンプトを入力すると、2種類の匿名モデルによる回答が表示され、ユーザーがより優れた回答を返してきたモデルに投票すると、モデルの正体が明らかになる。ユーザーは自分でモデルを選択してテストすることもできる[1][2]。
OpenAI、Google DeepMind[3]、Anthropic[4]などの企業が同社に大規模言語モデルを提供している。
このウェブサイトは、今後リリース予定のモデルの事前公開に利用されている。中国企業DeepSeekは、同社の「R1」モデルが西側メディアで注目を集めた数ヶ月前にArenaでプロトタイプのモデルをテストしていた[5]。その他の有名な事前公開モデルとして、OpenAIのGPT-5(コードネーム「Summit」)や、Google DeepMindの画像生成・編集モデルのGemini-2.5-Flash-Image(コードネーム「nano-banana」)がある[6][7]。
研究では、Arenaの方法論には特定の限界があることが明らかになっている[8][9]。
歴史
Chatbot Arenaは2023年4月24日に公開された[10]。
2024年6月、Chatbot Arenaは画像に対応した[11]。
2024年9月、Chatbot Arenaは独自の専用ドメイン名「lmarena.ai」(LMarena)に移行した[12]。
2025年4月、MetaはLlama 4を公開した。Llama 4 MaverickはLMArenaでGPT-4oとGemini 2.0 Flashを上回ったが、LMArena上のMaverick版は一般公開版と不当な差異があった。LMArenaはこの件を受け、同サイトのポリシーを更新した[13]。
2025年4月、LMArenaは独立企業として法人化した[14]。同年5月、LMArenaはシード資金調達ラウンドで1億ドルを調達し、企業価値は6億ドルとなった[15]。シード資金調達ラウンドにはAndreessen Horowitz、UC Investments、Lightspeed Venture Partners、Felicis Ventures、Kleiner Perkinsなどが参加した[15]。
2026年1月6日、LMArenaは1億5000万ドルのシリーズA資金調達ラウンドを完了したことを発表し、同社の資金調達後の評価額は約17億ドルとなった。このラウンドはFelicisとUC Investments(カリフォルニア大学)が主導し、Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners、Laude Venturesが参加した[16]。
2026年1月、LMArenaは動画に対応した[17]。
2026年1月28日、LMArenaはブランド名を「Arena」に変更した[18]。
脚注
- ^ Hart (2024年7月18日). “What AI Is The Best? Chatbot Arena Relies On Millions Of Human Votes”. Forbes. 2025年4月21日閲覧。
- ^ Kruppa (2024年12月5日). “The UC Berkeley Project That Is the AI Industry's Obsession”. The Wall Street Journal. 2025年4月21日閲覧。
- ^ Nuñez, Michael (2024年11月15日). “Google Gemini unexpectedly surges to No. 1, over OpenAI, but benchmarks don't tell the whole story”. VentureBeat. 2025年4月21日閲覧。
- ^ Edwards, Benj (2024年3月27日). “"The king is dead"—Claude 3 surpasses GPT-4 on Chatbot Arena for the first time”. Ars Technica. 2025年4月21日閲覧。
- ^ Metz (2025年2月18日). “Before DeepSeek Blew Up, Chatbot Arena Announced Its Arrival”. Bloomberg News. 2025年4月21日閲覧。
- ^ Ziff (2025年8月26日). “Google Gemini's AI image model gets a 'bananas' upgrade”. TechCrunch. 2025年8月27日閲覧。
- ^ Langley (2025年8月19日). “Is Google behind a mysterious new AI image generator? These bananas might confirm it”. Business Insider. 2025年8月27日閲覧。
- ^ Stokel-Walker (2025年2月6日). “Hundreds of rigged votes can skew AI model rankings on Chatbot Arena, study finds”. Fast Company. 2025年4月21日閲覧。
- ^ Wiggers (2024年9月5日). “The AI industry is obsessed with Chatbot Arena, but it might not be the best benchmark”. TechCrunch. 2025年4月21日閲覧。
- ^ “Chatbot Arena” (英語). Arena Blog (2023年5月4日). 2026年2月11日閲覧。
- ^ “The Multimodal Arena is Here!”. Arena Blog (2024年6月27日). 2026年2月3日閲覧。
- ^ arena.ai [@arena] (20 September 2024). “We are happy to announce a new site for Chatbot Arena!”. X(旧Twitter)より2026年1月30日閲覧.
- ^ Robison, Kylie (2025年4月8日). “Meta got caught gaming AI benchmarks”. The Verge. 2026年2月13日閲覧。
- ^ LMArena (2025年4月17日). “LMArena is Growing to Support our Community Platform | LM Arena”. blog.lmarena.ai. 2025年5月24日時点のオリジナルよりアーカイブ。2026年1月30日閲覧。
- ^ a b Wiggers, Kyle (2025年5月21日). “LM Arena, the organization behind popular AI leaderboards, lands $100M” (英語). TechCrunch. 2025年5月21日時点のオリジナルよりアーカイブ。2026年1月30日閲覧。
- ^ Wiggers, Kyle (2025年5月21日). “LM Arena, the organization behind popular AI leaderboards, lands $100M” (英語). TechCrunch. 2026年2月11日閲覧。
- ^ “Video Arena Is Live on Web”. Arena Blog (2026年1月21日). 2026年2月4日閲覧。
- ^ “LMArena is now Arena”. Arena Blog (2026年1月28日). 2026年1月28日閲覧。
外部リンク
- Arena (AIプラットフォーム)のページへのリンク