Gemini (チャットボット)
(Google_Gemini から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2026/05/11 14:19 UTC 版)
| |
|
| 開発元 | Google AI Google DeepMind |
|---|---|
| 初版 | 2023年3月21日 |
| 最新版 |
2024年2月8日
|
| 対応OS | ウェブアプリケーション Android iOS ChromeOS |
| 前身 | Google アシスタント |
| 対応言語 | 46の言語 |
| サポート状況 | 開発中 |
| 種別 | 人工知能 バーチャルアシスタント チャットボット |
| 公式サイト | gemini |
Gemini(ジェミニ[1][2])、旧称Bard(バード)は、Googleが開発した生成AIチャットボットである。同名の大規模言語モデル (LLM) を搭載し、OpenAIのChatGPTの急速な普及に対抗する形で開発された。2023年3月21日にアメリカとイギリスで公開され[3]、5月に他の国々へ展開された。以前はPaLM、初期にはLaMDAシリーズの大規模言語モデルが使用されていた。
2024年2月8日に名称を当初のBard(バード)からGeminiに変更するとともに、全世界で一般公開された[4]。同月からAndroid 10以降のOSを搭載するスマートフォンにアプリが順次搭載された[5]。バーチャルアシスタントの機能を備えており、2025年後半までにほとんどの機能がGoogle アシスタントから移植される見通しで、Android 10以降のデバイスでGoogleアシスタントが廃止されることが決定している[6]。
概要
Bardは、2023年2月6日に発表、同年3月21日に提供を開始した会話型人工機能である。初版は同社が2021年に発表した大規模言語モデルLaMDAを活用して開発された[7]。2023年4月にPaLM、2023年5月に、より性能の高いPaLM2へ切り替えた[8][9]。2024年2月、性能向上と名称変更を目的に、Gemini 1.0 Proが移植された[10]。
旧製品名の「Bard(バード)」は「吟遊詩人」という意味で、質問を打ち込むと、自然な文章で回答してくれることに由来していた[11]。
他社の会話型AIとの違い
GeminiとChatGPTとの最大の違いは、搭載する言語モデルが異なる点であり、GeminiはGeminiファミリーを搭載し、ChatGPTはGPTファミリーを搭載する。根本となるLLMが異なるので様々な違いが見られるが、Googleが優位性をアピールしているのは回答速度とロジックの扱い、コーディングである。
また、マイクロソフト製のチャットボット「Microsoft Copilot」は、リリース当初からOpenAI製のGPT-4を搭載していた上、Bing検索と連動して最新情報を提供できた[12]。
UIに言語モデルを直接埋め込んでいるMicrosoft Copilotとは異なり、Geminiのチャット画面は、Googleの検索インタフェースとは切り離された専用ページで提供されている[13]。
歴史
LaMDAの発表
旧Bardで活用されている技術、LaMDA(Language Model for Dialogue Applications)は、2021年にGoogleが発表した対話型AIの言語モデルで、GPT-4に活用されているTransformerの識別モデルとは異なり生成モデルであるという特徴を持つ[14]。
ChatGPTの提供開始
OpenAIは、2022年11月30日に自社製の大規模言語モデルGPT-3.5を活用した会話型人工知能「ChatGPT」の提供を開始した。従来の人工知能とは一線を画す、精密な返答と導入の手軽さから世界規模で急速に利用者が増加し、2023年1月には推定ユーザー数1億人到達記録を塗り替えるなど会話型人工知能市場の独占に成功する[15][16]。この時点でGoogleは収入の大半を占める広告収入の減少を懸念し、警戒感を示すようになっていく。
ChatGPTへの警戒
2022年11月に一般公開されたChatGPTは、先述の通り急速にユーザー数を獲得していった。Googleは、会話型AIの登場で「検索して情報を得る」という現在の考え方が、「AIに聞いて情報を得る」という考え方に変化することに警戒感を抱いていた。これには、Googleの親会社であるAlphabetのビジネスモデルが大きく関わっている。同社の売上高全体に占める広告収入の割合は81%で[17]、Metaと共にインターネット広告市場で圧倒的なシェアを握っていた。ChatGPTの登場は、Alphabetの広告収入の要である検索サービス自体が効力を持たなくなるという流れになりかねないため、Googleは危機感を抱かざるを得なかった。また近年、AmazonやAppleなどの広告市場への本格的な参入により、市場に占めるGoogleとMetaの割合が過半数を割るなど[18]、広告に頼る現在のビジネス方針の転換を迫られていたことも背景に、GoogleはAI関連の開発者を増員するなどChatGPTに対抗する姿勢を見せる[19]。
コードレッドの発出とマイクロソフトのAI市場介入
Googleは2022年12月、社内でコードレッドと呼ばれる厳戒警報を発令した[20]。ChatGPTの脅威に対処するため人員の再編成を行ったり[21]、一部のメディアではGoogleの共同創業者2人が復帰したと報道された[22]。その反面、BingAIのように「検索エンジン自体に会話型AIを組み込む」ということに対しては、あまり積極的ではなかった。それは、Googleは広告と検索があってこそであり、ページにアクセスせず情報を手に入れられてしまう会話型AIは利益を生みづらい。Alphabetのビジネスモデルを根底から破壊してしまう懸念があった。しかし、OpenAIに繰り返し大規模な投資を行ってきたマイクロソフトが自社の検索サービスであるBingにGPT-3.5の後継バージョン、GPT-4を活用したチャットボットを導入[23]。導入後、Googleから検索市場のシェアを5%程度を奪ったと報じられるなど、検索市場でのシェア減少と会話型AI市場への乗り遅れの懸念から、Googleは会話型AIを発表する。
Bardの発表と失態
2023年2月6日、GoogleはLaMDAを活用した会話型人工知能「Bard(バード)」を発表した。
しかし、急遽発表した影響もあり、具体的な提供開始時期を示さず、表現を「近日公開」にとどめた[24]。また発表の中で使用したBardの回答が誤っていたことが判明し[25]、社内からも「急ぎすぎた」などといった批判が噴出する[26]。Googleはこの間違いを認め、同年3月21日に提供が開始された際には「Bardは自信満々に間違えることがある」と注意喚起をする事態となった[27]。
PaLMの導入を示唆
Googleの最高経営責任者のスンダー・ピチャイは2023年3月31日、急速に発展しているAI市場に関する『ニューヨーク・タイムズ』のインタビューに応じた[28]。インタビューの中でBardは「レーシングカーの競技に、チューンアップした大衆車を投入したように感じている」と語り、Bardは他社のチャットボットと比較して未熟だと認めた。その上で「われわれの手元にはより強力なモデルがある。近日中、おそらくこの記事が報道される頃には、Bardをアップグレードし、推論やコーディング、数学の質問に対するより優れた応答ができる、大規模言語モデル『PaLM(Pathways Language Model)[29]』を導入されているだろう」と述べた[30]。
PaLMの導入
2023年4月10日、Googleは計算能力などの向上を目的として、BardのLLMをLaMDAからPaLMへと変更したと発表した。PaLMはLaMDAと比較してパラメーター数が数倍に増加しているため、NLP能力が向上し、計算や論理的思考がより高度になったとGoogleは主張している。
PaLM2への切り替え
Googleは2023年5月10日に開催した開発者会議「Google I/O 2023」でPaLM2を発表し、同日Bardへの導入を開始した。PaLM2では従来のLLMをより発展させたものとなっている。
新たなGoogle Labsの提供開始
Googleは2023年5月10日、Google検索の大幅な刷新を行うと発表し、即日提供を開始した。Microsoft Bingに搭載されているMicrosoft Copilot(Bing AI)に似た機能となっていて、プロモーションビデオではこれまでの検索方法である「複数単語を組み合わせる」から「文章で質問する」という形に変わったほか、Googleが今まで消極的だった検索エンジンにAIを組み込むなど、Googleのビジネスモデルの転換点となった。
Adobe Fireflyとパートナー契約の締結
2023年5月10日、GoogleはAdobe Firefly(英語版)とのパートナー契約を結んだと発表した。これにより、Adobe Fireflyの機能がBard内で使用できるようになる。
Google Workspaceへの導入
Googleは2023年5月10日、Google Workspace(オフィスソフト)との連携することを同じくGoogle I/O 2023内で公表した。
Gemini 1.0 Proの導入
Googleは2024年2月1日、Gemini(旧Bard)が活用する大規模言語モデルをGemini 1.0 Proに切り替えた。推論や要約、記述、ブレインストーミングなどあらゆる場面において、PaLM2より性能が向上した。また同日、英語版Geminiでは無料で画像生成AIを利用できるようになった。Imagen2を活用している[31]。
これに併せてGoogleは、ダブルチェック機能を国内で展開すると発表した。これは、Googleの検索結果とGeminiの回答を結びつける機能で、ソースや真偽の確認に活用される。
あわせて、定期購入サービス「Gemini Advanced」の展開を始めた。最上位モデルのGemini 1.0 Ultraが利用できるほか、Pythonコードをチャット上で実行できる機能などが搭載された。
Gemini 1.5 Proの導入
2024年5月、Gemini AdvancedにGemini 1.5 Proが搭載され、100万トークン(1500ページ相当)までの情報処理とデータ分析が可能になった。同時にドキュメントアップロード機能が追加される。教育機関向けに「Gemini Education」が発表されたほか、対象デバイスにGeminiアプリの展開が始まった。
周辺サービスとの連携を開始
2024年7月、Google Workspace管理者向けにGmail、Googleドライブ用のGemini拡張機能のベータ版テストプログラムを開始。GeminiがユーザーのメールボックスやGoogleドライブにアクセスし、情報抽出できるようになった。一般ユーザー向けのGeminiに1.5 Flashが搭載され、速度と効率が最適化されたモデルが一般に提供開始。コンテキストウィンドウが32,000トークンに拡大された。
Gemの展開開始
2024年8月、カスタムAIエキスパート「Gem」が導入され、目的に合わせてGeminiをカスタマイズできるようになる。ChatGPTの「GPTs」やClaudeの「Projects」に事実上対抗する機能で、事前に資料や指示を与えておくことができるようになった。同時期、Gemini AdvancedにGemini 1.5 Proの新バージョンが搭載され、推論やコーディングに関連する機能が強化される。またGeminiの使用要件が緩和され、13歳以上のユーザーかつ40以上の言語に対応した。
年表
- 2023年
- 2月6日 - Bard試験運用版正式発表。
- 3月21日 - アメリカ合衆国、イギリスでの提供開始。
- 4月10日 - Bardに初のアップデートを提供。LaMDAからPaLMへとLLMが変更された[32]。
- 4月18日 - 日本国内からのアクセスが解禁。
- 4月21日 - Bardに2回目のアップデート[32]。
- 5月5日 - Google Workspaceとの連携を開始[32]。
- 5月10日 - 日本語と韓国語に新たに対応し、待機リストが撤廃され180以上の国と地域で使用可能となる。
- 5月15日 - 文書の要約能力が強化され、出典が明記されるようになる。
- 5月23日 - Google画像検索から画像を表示できるようになる[33]。
- 6月1日 - 任意で位置情報の読み取りを開始、より正確な情報を提供できるようになる。
- 6月7日 - バックグラウンドでコードの実行が可能に。より正確な数学的タスクをこなせるようになる。
- 7月13日 - 新たに40以上の言語に対応し音声読み上げに対応。サイトのUIが抜本的に変更され、複数のチャットルームの作成が可能となる。英語版では画像アップロードが可能となる。また、コードユニットをReplitに送信することも可能となる[32]。
- 9月27日 - Bardの回答方法・フィードバックの方法が変更された。
- 10月23日 - 日本語で画像のアップロードに対応。メールの要約可能容量が従来の水準から引き上げられる。
- 10月30日 - ChatGPTのように生成中の文章をリアルタイムで表示可能になる。
- 11月16日 - 英語の会話のみ、世界のほとんどの国で13歳以上のユーザーが利用可能になる。
- 12月18日 - 英語に加え、日本語と韓国語でも、Bard を使用して Google のアプリやサービスの有用な情報にアクセスできるようになる[34]。
- 2024年
- 2月1日 - Gemini 1.0 Proが、Bardの提供されているすべての言語で利用可能となる。Bard の回答の再確認機能が、ほとんどの対応言語で利用できるようになる。
- 2月8日 - 試験運用を終了し、同時に全世界で一般公開。また、BardからGeminiへ改名[35]。
- 4月9日 - Gemini 1.5 Pro(プレビュー版)を提供開始[36]。
- 5月10日 - Gemini 1.5 Flash(プレビュー版)を提供開始[36]。
- 5月23日 - Gemini 1.5 Pro と Gemini 1.5 Flash を提供開始[36]。
- 12月11日 - Gemini 2.0 Flash(試験運用版)を提供開始[36]。
- 2025年
Google I/O 2023での発表内容
Googleは2023年5月10日に、同社の開発者会議であるGoogle I/O 2023を開催した。Google I/O 2023で発表された、旧Bardに関連するアップデート内容を紹介する。
PaLM2の導入
旧Bardは当初、LaMDAを活用して運用されていたが、計算能力の強化を目的にPaLMを導入した。Google I/O 2023で、PaLMをさらに発展させたPaLM2に切り替えると発表し、即日導入された。これにより、日本語への対応や、多言語翻訳、推論などでより高度な情報を提供できるようになるという[37]。
Google検索への導入
Google検索に「Search Generative Experience(サーチゲネレーティブエクスペリエンス、SGE)」の導入が発表された。これは、今までGoogleが消極的だった検索エンジンに会話型AIサービスを組み込むというもの。SGEは従来のリスト式の検索エンジンとは180度転換されるもので、AIが持つ情報やGoogleの検索結果を元に内容を説明し、根拠となるソースをユーザーに提供する。複数の単語を組み合わせて検索していた従来の検索方法は、文章で質問する方向へ移り変わる。
SGEの主な機能として、検索結果に関連するテキスト、画像、動画を生成することができる。これにより、ユーザーは検索結果をより深く理解し、より多くの情報を見つけることができるようになる。たとえば、SGEを使用して「ピザ」を検索すると、ピザの作り方の動画、ピザ店の評価、ピザの作り方に関する記事など、検索結果に関連するコンテンツを生成できる。
なお、この機能は現在一部の国でのみアクセスが可能なほか、信頼できるテスターのみへの提供となっている[38]。
Google Workspaceとの連携
GoogleはMicrosoft Copilotへの対抗として、Google WorkspaceとGeminiの連携を強めている。主に2つの内容が発表された。
オフィスソフト
Google WorkspaceのオフィスソフトにPaLM2を採用したAIを導入すると発表した。これによると、Gmailで下書きの生成、文章の要約、文書からプレゼンテーションの作成、旧Bardの回答をGoogleドキュメントへ出力することが可能になった[39]。なお、この機能は2023年6月以降の展開となる。
組織アカウント
2023年5月5日のアップデートで旧BardとGoogle Workspaceの連携を開始した。Google Workspaceの組織管理者アカウントはドメインで旧Bardを有効にできるようになり、ユーザーはWorkspaceアカウントを使用して旧Bardにアクセスできるようになった。企業や学校などの大量にアカウントを管理する場面で活用が広がる可能性がある[40]。
Adobe Fireflyと連携
AdobeとGoogleは、画像生成AIである「Adobe Firefly(英語版)」とGoogleの会話型AI「Bard」がパートナーになると発表した。Bardに画像生成を依頼すると、Adobe Fireflyの技術で画像が生成される。この機能は今後数ヶ月以内に順次展開される[41]。
日本での利用
2023年4月18日、日本国内からのアクセスが解禁された[42]。また2023年5月10日、日本語と韓国語に対応したほか、待機リストを撤廃して誰でも自由に使えるものとなった[8]。
2026年4月21日、日本でもGoogle Chromeへの搭載を開始、Google アカウントを持つ18歳以上が無料で利用可能となった[43]。
脚注
- ↑ “Googleの新AI、日本では「ジェミニ」「ジェミナイ」どっち? 公式見解は”. ITmedia NEWS (2023年12月8日). 2025年8月5日閲覧。
- ↑ “Geminiの日本語名は「ジェミニ」です Googleが再告知”. CNET Japan (2026年1月21日). 2026年1月21日閲覧。
- ↑ “グーグルが対話型AI「Bard」を一般公開、米国と英国で先行”. 日経クロステック (2023年3月22日). 2023年4月1日閲覧。
- ↑ Dastin, Jeffrey、Dastin, Jeffrey「グーグル、対話型AIを「ジェミニ」に改名 有料の高性能版も」『Reuters』2024年2月9日。2024年2月16日閲覧。
- ↑ “Bard から Gemini へ:Ultra 1.0 とGemini アプリを発表”. Google (2024年2月8日). 2025年4月2日閲覧。
- ↑ “The Assistant experience on mobile is upgrading to Gemini” (英語). Google (2025年3月14日). 2025年4月2日閲覧。
- ↑ “Bard(バード)とは”. 日本経済新聞. 2023年4月1日閲覧。
- 1 2 “Googleの対話型AI「Bard」が日本語に対応、最新のPaLM 2ベースに”. 日経クロステックlanguage=ja (2023年5月11日). 2023年5月12日閲覧。
- ↑ “Googleの生成AI「Bard」が日本語に対応、大規模言語モデル「PaLM 2」搭載”. INTERNET Watch. インプレス (2023年5月11日). 2023年6月15日閲覧。
- ↑ “GoogleのAI「Bard」、日本語で「Gemini Pro」と「G」ボタン対応 英語なら描画も可能に”. ITmedia NEWS (2024年2月2日). 2024年2月2日閲覧。
- ↑ “グーグル、対話型AI搭載の検索サービス「バード」を開始”. 読売新聞オンライン (2023年3月22日). 2023年4月1日閲覧。
- ↑ “マイクロソフトが新しいAI機能発表、BingユーザーにGPT-4への無料アクセスを提供”. Cointelegraph (2023年5月5日). 2023年6月15日閲覧。
- ↑ Nast, Condé (2023年3月21日). “グーグルが会話型AI「Bard」を一般公開、“ChatGPT対抗”を急ぐ事情と共通する弱点の中身”. WIRED.jp. 2023年4月1日閲覧。
- ↑ “グーグル、自然な会話を実現する言語モデル「LaMDA」発表--高度な検索目指す「MUM」技術も”. ZDNet Japan (2021年5月19日). 2023年4月1日閲覧。
- ↑ “ChatGPT、月間アクティブユーザー数が1億人突破”. Gadget Gate. 2023年4月1日閲覧。
- ↑ “ChatGPTが「月間1億ユーザー」をわずか2カ月で達成し史上最も急速に成長していることが報告される”. GIGAZINE (2023年2月3日). 2023年4月1日閲覧。
- ↑ “収益構造でFacebookは98%・Googleは81%を広告に依存しており脆弱性と化している”. GIGAZINE (2022年2月4日). 2023年4月1日閲覧。
- ↑ 小久保重信 (2023年1月29日). “ついに5割切るGoogleとMetaのネット広告シェア、その要因探る”. Yahoo!ニュース. 2023年4月1日閲覧。
- ↑ “グーグル・メタを差し置いて、アマゾンの広告事業が伸び続ける3つの理由”. ITmedia ビジネスオンライン (2023年2月28日). 2023年4月1日閲覧。
- ↑ “Googleが発した厳戒「コードレッド」”. 日本経済新聞 (2023年3月18日). 2023年4月1日閲覧。
- ↑ “ChatGPTのリリースでGoogleは「コードレッド」を宣言、AIチャットボットが検索ビジネスにもたらす脅威に対応するためにチームを再割り当て”. GIGAZINE (2022年12月23日). 2023年4月18日閲覧。
- ↑ “グーグル創業者が数年ぶりに現場復帰、AI部門のテコ入れで”. Forbes JAPAN (2023年2月2日). 2023年4月18日閲覧。
- ↑ “新しい Bing が OpenAI の GPT-4 上で稼働”. News Center Japan (2023年3月15日). 2023年4月1日閲覧。
- ↑ “Google、会話型AIサービス「Bard」を発表 ~近々正式リリースへ/検索とは異なるアプローチでユーザーを答えに導く”. 窓の杜 (2023年2月7日). 2023年4月1日閲覧。
- ↑ “GoogleのChatGPT競合「Bard」のデモ回答に誤り──天文学者らが指摘”. ITmedia NEWS (2023年2月9日). 2023年4月1日閲覧。
- ↑ “Google社員は「Bard」の性急すぎる発表に不満を抱いている”. GIGAZINE (2023年2月12日). 2023年4月1日閲覧。
- ↑ “Google、対話AIのBard一般公開 「自信満々に間違う」注記”. 日本経済新聞 (2023年3月22日). 2023年4月1日閲覧。
- ↑ Roose, Kevi (2023年3月31日). “Google C.E.O. Sundar Pichai on the A.I. Moment: ‘You Will See Us Be Bold” (英語). ニューヨーク・タイムズ. ISSN 0362-4331 2023年4月20日閲覧。
- ↑ “Pathwaysの恐るべき威力、ベールを脱いだグーグルの万能AIが目指す究極形とは”. 日経クロステック (2022年4月15日). 2023年4月20日閲覧。
- ↑ “グーグルCEO、「Bard」のアップデートを予告--現状は「チューンアップした大衆車」”. CNET Japan (2023年4月4日). 2023年4月20日閲覧。
- ↑ “日本語の Bard でも Gemini Pro が利用可能に。 あわせて、回答を確認するダブルチェック機能も公開。”. Google Japan Blog (2024年2月2日). 2024年2月2日閲覧。
- 1 2 3 4 “Bard” (英語). bard.google.com. 2023年12月1日時点のオリジナルよりアーカイブ。2023年7月13日閲覧。
- ↑ “グーグルの「Bard」、画像を含む回答が可能に 視覚的に分かりやすく”. ZDNET Japan (2023年5月25日). 2026年5月5日閲覧。
- ↑ 株式会社インプレス (2023年12月19日). “Google、「Bard」の拡張機能を日本でも利用可能に ~GmailやYouTubeも使って回答/「Google Workspace」、「Google ホテル」、「Google マップ」などの拡張機能も”. 窓の杜. 2026年5月5日閲覧。
- ↑ “グーグルBard、「Gemini」に生まれ変わる 最上位AIモデルは月2900円”. Impress Watch (2023年2月8日). 2024年2月11日閲覧。
- 1 2 3 4 5 6 7 8 9 10 “リリースノート”. Gemini API - Google AI for Developers. 2025年12月11日閲覧。
- ↑ “Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み”. GIGAZINE (2023年5月11日). 2023年5月11日閲覧。
- ↑ “グーグル、AI搭載した新たな検索エンジン「SGE」を発表”. CNET Japan (2023年5月11日). 2023年5月11日閲覧。
- ↑ “「Google Workspace」に生成AI搭載へ 文章からスライド用の画像生成、スプレッドシートでリスト作成など”. ITmedia NEWS (2023年5月11日). 2023年5月11日閲覧。
- ↑ “Googleの生成AI「Bard」が「Google Workspace」からも利用可能に ~管理者がON/OFF可能/デフォルトの値はOFF。ドメイン・組織単位・グループごとに有効化できる”. 窓の杜 (2023年5月8日). 2023年5月11日閲覧。
- ↑ “まさかの組み合わせ。GoogleのAI 「Bard」、画像生成AI「Adobe Firefly」とパートナーに #GoogleIO”. ギズモード (2023年5月11日). 2023年5月11日閲覧。
- ↑ “日本からGoogleのAI「Bard」のベータテストに参加できるようになりました!【追記あり】”. ギズモード (2023年4月18日). 2023年4月18日閲覧。
- ↑ “グーグルの生成AI「ジェミニ」、日本でもクロームに搭載…画面右上に「相談」ボタン”. 読売新聞オンライン. 2026年4月22日. 2026年4月22日閲覧.
関連項目
- Google
- Gemini (言語モデル) - Geminiに搭載された大規模言語モデル
- BERT (言語モデル) / LaMDA / PaLM
- DeepMind - Geminiの開発元
- Gemma - DeepMindが開発した小規模言語モデル
- Gato (DeepMind) - DeepMindが開発したマルチモーダル・ニューラル・ネットワーク
- OpenAI / ChatGPT - ライバル視された競合他社とそのモデル
外部リンク
- Gemini (チャットボット)のページへのリンク