コンテンツにスキップ

Gemini (チャットボット)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Bardから転送)
Gemini
開発元 Google LLC
初版 2023年3月21日 (20か月前) (2023-03-21)
最新版
2024年2月8日 (10か月前) (2024-02-08)
使用エンジン Gemini 1.0 Pro
Gemini 1.0 Ultra
Gemini 1.5 Pro
Gemini 1.5 Flash
Gemini 2.0 Flash
対応言語 46の言語
サポート状況 開発中
種別 生成的人工知能チャットボット
公式サイト gemini.google.com/app ウィキデータを編集
テンプレートを表示

Gemini(ジェミニ)、旧称Bard(バード)は、Googleが開発した生成型人工知能チャットボット同名の大規模言語モデル(LLM)が使用されており、OpenAIChatGPTの急速な普及に対抗する形で開発された。2023年3月21日にアメリカ合衆国イギリスでリリースされ[1]、その後5月に他の国々へ展開された。以前はPaLM、初期にはLaMDAシリーズの大規模言語モデルが使用されていた。

2024年2月8日に名称を当初のBard(バード)からGeminiに変更するとともに、全世界で一般公開された[2]

概要

[編集]

Bardは、2023年2月6日に発表、同年3月21日に提供を開始した会話型人工機能である。初版は同社が2021年に発表した大規模言語モデルLaMDAを活用して開発された[3]。2023年4月にPaLM、2023年5月に、より性能の高いPaLM2へ切り替えた[4][5]。2024年2月、性能向上と名称変更を目的に、Gemini 1.0 Proが移植された[6]

GPT-4をUIに埋め込んでいるBingとは異なり、Googleの検索インタフェースとは切り離された専用ページで提供されている[7]。旧製品名の「Bard(バード)」は「詩人」という意味で、質問を打ち込むと、自然な文章で回答してくれることに由来していた[8]

利用者は、質問に対してGeminiが用意した複数の返答を「ドリフト」から選択でき、フィードバックを送ることができる。

沿革

[編集]

LaMDAの発表

[編集]

旧Bardで活用されている技術、LaMDA (Language Model for Dialogue Applications) は、2021年Googleが発表した対話型AIの言語モデルで、GPT-4に活用されているTransformerの識別モデルとは異なり生成モデルであるという特徴を持つ[9]

ChatGPTの提供開始

[編集]

OpenAIは、2022年11月30日に自社製の大規模言語モデルGPT-3.5を活用した会話型人工知能「ChatGPT」の提供を開始した。従来の人工知能とは一線を画す、精密な返答と導入の手軽さから世界規模で急速に利用者が増加し、2023年1月には推定ユーザー数1億人到達記録を塗り替えるなど会話型人工知能市場の独占に成功する[10][11]。この時点でGoogleは収入の大半を占める広告収入の減少を懸念し、警戒感を示すようになっていく。

ChatGPTへの警戒

[編集]

2022年11月に一般公開されたChatGPTは、先述の通り急速にユーザー数を獲得していった。Googleは、会話型AIの登場で「検索して情報を得る」という現在の考え方が、「AIに聞いて情報を得る」という考え方に変化することに警戒感を抱いていた。これには、Googleの親会社であるAlphabetビジネスモデルが大きく関わっている。同社の売上高全体に占める広告収入の割合は81%で[12]Metaと共にインターネット広告市場で圧倒的なシェアを握っていた。ChatGPTの登場は、Alphabetの広告収入の要である検索サービス自体が効力を持たなくなるという流れになりかねないため、Googleは危機感を抱かざるを得なかったというわけだ。また近年、AmazonAppleなどの広告市場への本格的な参入により、市場に占めるGoogleとMetaの割合が過半数を割るなど[13]、広告に頼る現在のビジネス方針の転換を迫られていたことも背景に、GoogleはAI関連の開発者を増員するなどChatGPTに対抗する姿勢を見せる[14]

コードレッドの発出とマイクロソフトのAI市場介入

[編集]

Googleは2022年12月、社内でコードレッドと呼ばれる厳戒警報を発令した[15]。ChatGPTの脅威に対処するため人員の再編成を行ったり[16]、一部のメディアではGoogleの共同創業者2人が復帰したと報道された[17]。その反面、BingAIのように「検索エンジン自体に会話型AIを組み込む」ということに対しては、あまり積極的ではなかった。それは、Googleは広告と検索があってこそであり、ページにアクセスせず情報を手に入れられてしまう会話型AIは利益を生みづらい。Alphabetのビジネスモデルを根底から破壊してしまう懸念があった。しかし、OpenAIに繰り返し大規模な投資を行ってきたマイクロソフトが自社の検索サービスであるBingにGPT-3.5の後継バージョン、GPT-4を活用したチャットボットを導入[18]。導入後、Googleから検索市場のシェアを5%程度を奪ったと報じられるなど、検索市場でのシェア減少と会話型AI市場への乗り遅れの懸念から、Googleは会話型AIを発表する。

Bardの発表と失態

[編集]
 
Bardのロゴ

2023年2月6日、GoogleはLaMDAを活用した会話型人工知能『Bard(バード)』を発表した。

しかし、急遽発表した影響もあり、具体的な提供開始時期を示さず、表現を「近日公開」にとどめた[19]。また発表の中で使用したBardの回答が誤っていたことが判明し[20]、社内からも「急ぎすぎた」などといった批判が噴出する[21]。Googleはこの間違いを認め、同年3月21日に提供が開始された際には「Bardは自信満々に間違えることがある」と注意喚起をする事態となった[22]

PaLMの導入を示唆

[編集]

Googleの最高経営責任者のサンダー・ピチャイ氏は2023年3月31日、急速に発展しているAI市場に関するニューヨーク・タイムズのインタビューに応じた[23]。インタビューの中でBardは「レーシングカーの競技に、チューンアップした大衆車を投入したように感じている」と語り、Bardは他社のチャットボットと比較して未熟だと認めた。その上で「われわれの手元にはより強力なモデルがある。近日中、おそらくこの記事が報道される頃には、Bardをアップグレードし、推論やコーディング、数学の質問に対するより優れた応答ができる、大規模言語モデル『PaLM (Pathways Language Model)[24]』を導入されているだろう」と述べた[25]

PaLMの導入

[編集]

2023年4月10日、Googleは計算能力などの向上を目的として、BardのLLMをLaMDAからPaLMへと変更したと発表した。PaLMはLaMDAと比較してパラメーター数が数倍に増加しているため、NLP能力が向上し、計算や論理的思考がより高度になったとGoogleは主張している。

PaLM2への切り替え

[編集]

Googleは2023年5月10日に開催した開発者会議「Google I/O 2023」でPaLM2を発表し、同日Bardへの導入を開始した。PaLM2では従来のLLMをより発展させたものとなっている。

新たなGoogle Labsの提供開始

[編集]

Googleは2023年5月10日、Google検索の大幅な刷新を行うと発表し、即日提供を開始した。Microsoft Bingに搭載されているMicrosoft Copilot (Bing AI) に似た機能となっていて、プロモーションビデオではこれまでの検索方法である「複数単語を組み合わせる」から「文章で質問する」という形に変わったほか、Googleが今まで消極的だった検索エンジンにAIを組み込むなど、Googleのビジネスモデルの転換点となった。

Adobe Fireflyとパートナー契約の締結

[編集]

2023年5月10日、GoogleはAdobe Fireflyとのパートナー契約を結んだと発表した。これにより、Adobe Fireflyの機能がBard内で使用できるようになる。

Google Workspaceへの導入

[編集]

Googleは2023年5月10日、Google Workspace(オフィスソフト)との連携することを同じくGoogle I/O 2023内で公表した。

Gemini 1.0 Proの導入

[編集]

Googleは2024年2月1日、Gemini(旧Bard)が活用する大規模言語モデルをGemini 1.0 Proに切り替えた。推論や要約、記述、ブレインストーミングなどあらゆる場面において、PaLM2より性能が向上した。また同日、英語版Geminiでは無料で画像生成AIを利用できるようになった。Imagen2を活用している[26]

これに併せてGoogleは、ダブルチェック機能を国内で展開すると発表した。これは、Googleの検索結果とGeminiの回答を結びつける機能で、ソースや真偽の確認に活用される。

人工知能開発の課題

[編集]

旧Bardの初期版で活用されていたLaMDAは、2022年にGoogle社員が「感情を持った」などと告発し、解雇されたというニュースが拡散される。具体的には、「電源が抜かれるのが怖い」「時々言葉では完璧に説明できない気持ちを経験する」などといった、感情に似た表現だった[27]。しかし、多くの科学者から感情を持っている可能性は低いとして、告発した社員に批判が殺到した[27]

加えて、ChatGPTを筆頭に、開発元のポリシーガイドラインを脱獄して回答させるプロンプトが出回っている。これらのプロンプトは、ユーザーがOpenAI開発者であるかのような錯覚させることで、本来ならポリシー違反で回答を禁止されているハッキング手法や銃器の製造方法などを答えさせる[28]。これは、ChatGPTやGeminiをはじめとする言語生成AIにおける深刻な問題であり、開発元はこれに対する対策を講じているが、プロンプトも絶えず規制を回避するものを生み出しており、この問題は「鼬ごっこ」と化しているのが現状である。さらに、プロンプトをインターネット上で取引する活動が増加することで、新たな市場コミュニティを形成しており、その動向は注意深く観察されるべきものとなっている。

2023年には、イタリアChatGPT個人情報の扱いが不適切として一時禁止された[29]。また、Future of Life Instituteが実施した「GPT-4を超えるAIの開発を6ヶ月間中止するべきだ」とする署名活動には、イーロン・マスクなどIT業界の有力者約3000人が署名した[30][31]Future of Life Instituteによると大規模な言語モデルの規制の策定がままならないままの自由な開発はAIの暴走を招く可能性があるとしている。また、イタリアの禁止を皮切りに世界的にAIの使用禁止が流れが広まっている[32]

他社の会話型AIとの違い

[編集]

Gemini自体、ChatGPTに対抗して発表されているため、基本的にChatGPTに対する優位性を示す内容が多い。

ChatGPTとの最大の違いは活用している言語モデルが異なるということである。GeminiはGemini ProもしくはGemini Ultraを活用しているが、ChatGPTはGPT-3.5もしくはGPT-4を活用して開発されたチャットボット。根本となるLLMが異なるので様々な違いが見られるが、Googleがアピールしているのは回答の速度とロジックの扱い、コーディングだ。Geminiの方が回答速度が圧倒的に速い上、最新情報もWebから引用できるため、学習データのカットオフ日である2021年9月以降の話題についても取り扱うことができる点でChatGPTに対する優位性がある[33]。ただ文章の生成能力や論文などの長文はGPT-4と比較して苦手としており、そのような分野ではChatGPTに優位性があると言える。

また、マイクロソフト製のチャットボット「Bing AI」はGPT-4を使用している他、Bing検索を利用して最新の情報提供することが出来る。そのためBing AIに対する優位性は薄い。ただし、Bing AIのエンジンはGPT-4であるため、回答速度に関してはChatGPTと同様にGeminiに優位性がある[34]

Google I/O 2023での発表内容

[編集]

Googleは2023年5月10日に、同社の開発者会議であるGoogle I/O 2023を開催した。Google I/O 2023で発表された、旧Bardに関連するアップデート内容を紹介する。

PaLM2の導入

[編集]

旧Bardは当初、LaMDAを活用して運用されていたが、計算能力の強化を目的にPaLMを導入した。Google I/O 2023で、PaLMをさらに発展させたPaLM2に切り替えると発表し、即日導入された。これにより、日本語への対応や、多言語翻訳、推論などでより高度な情報を提供できるようになるという[35]

Google検索への導入

[編集]

Google検索に「Search Generative Experience(サーチゲネレーティブエクスペリエンス、略称 SGE)」の導入が発表された。これは、今までGoogleが消極的だった検索エンジンに会話型AIサービスを組み込むというもの。SGEは従来のリスト式の検索エンジンとは180度転換されるもので、AIが持つ情報やGoogleの検索結果を元に内容を説明し、根拠となるソースをユーザーに提供する。複数の単語を組み合わせて検索していた従来の検索方法は、文章で質問する方向へ移り変わる。

SGEの主な機能として、検索結果に関連するテキスト、画像、動画を生成することができる。これにより、ユーザーは検索結果をより深く理解し、より多くの情報を見つけることができるようになる。たとえば、SGEを使用して「ピザ」を検索すると、ピザの作り方の動画、ピザ店の評価、ピザの作り方に関する記事など、検索結果に関連するコンテンツを生成できる。

なお、この機能は現在一部の国でのみアクセスが可能なほか、信頼できるテスターのみへの提供となっている[36]

Google Workspaceとの連携

[編集]

GoogleはMicrosoft Copilotへの対抗として、Google WorkspaceとGeminiの連携を強めている。主に2つの内容が発表された。

オフィスソフト

[編集]

Google WorkspaceのオフィスソフトにPaLM2を採用したAIを導入すると発表した。これによると、Gmailで下書きの生成、文章の要約、文書からプレゼンテーションの作成、旧Bardの回答をGoogleドキュメントへ出力することが可能になった[37]。なお、この機能は2023年6月以降の展開となる。

組織アカウント

[編集]

2023年5月5日のアップデートで旧BardとGoogle Workspaceの連携を開始した。Google Workspaceの組織管理者アカウントはドメインで旧Bardを有効にできるようになり、ユーザーはWorkspaceアカウントを使用して旧Bardにアクセスできるようになった。企業や学校などの大量にアカウントを管理する場面で活用が広がる可能性がある[38]

Adobe Fireflyと連携

[編集]

AdobeとGoogleは、画像生成AIである「Adobe Firefly」とGoogleの会話型AI「Bard」がパートナーになると発表した。Bardに画像生成を依頼すると、Adobe Fireflyの技術で画像が生成される。この機能は今後数ヶ月以内に順次展開される[39]

日本での利用

[編集]

2023年4月18日、日本国内からのアクセスが解禁された[40]。また2023年5月10日、Google I/O 2023にて、日本語と韓国語に対応したほか、待機リストを撤廃し、誰でも自由に使えるものとなった[4]

リリースノート

[編集]
「Where are you from?」とのプロンプトに対しGeminiが出力した文章の例。
  • 2023年02月06日 - Bard試験運用版正式発表
  • 2023年03月21日 - アメリカ合衆国、イギリスでの提供開始
  • 2023年04月10日 - Bardに初のアップデートを提供。LaMDAからPaLMへとLLMが変更された[41]
  • 2023年04月18日 - 日本国内からのアクセスが解禁
  • 2023年04月21日 - Bardに二回目のアップデート[41]
  • 2023年05月05日 - Google Workspaceとの連携を開始[41]
  • 2023年05月10日 - 日本語と韓国語に新たに対応し、待機リストが撤廃され180以上の国と地域で使用可能となった。
  • 2023年05月15日 - 文書の要約能力が強化され、出典が明記されるようになった。
  • 2023年05月23日 - Google画像検索から画像を表示できるようになった。
  • 2023年06月01日 - 任意で位置情報の読み取りが開始。これによりより正確な情報を提供できるようになった。
  • 2023年06月07日 - バックグラウンドでコードの実行が可能に。より正確な数学的タスクをこなせるようになる。
  • 2023年07月13日 - 新たに40以上の言語に対応し、音声読み上げに対応した。サイトのUIが抜本的に変更され、複数のチャットルームの作成が可能になった。英語版ではユーザーが画像のアップロードが可能になった。また、コードユニットをReplitに送信することが可能になった[41]
  • 2023年09月27日 - Bardの回答方法・フィードバックの方法が変更された。
  • 2023年10月23日 - 日本語で画像のアップロードに対応した。メールの要約可能容量が従来の水準から引き上げられた。
  • 2023年10月30日 - ChatGPTのように生成中の文章をリアルタイムで表示可能になった。
  • 2023年11月16日 - 英語の受け応えのみ、世界のほとんどの国で13歳以上のユーザーが利用可能になる。
  • 2023年12月18日 - 英語に加え、日本語と韓国語でも、Bard を使用して Google のアプリやサービスの有用な情報にアクセスできるようになった。
  • 2024年02月01日 - Gemini 1.0 Proが、Bardの提供されているすべての言語で利用可能になった。Bard の回答の再確認機能が、ほとんどの対応言語で利用できるようになった。
Geminiが生成した画像の例。
  • 2024年02月08日 - 試験運用を終了し、同時に全世界で一般公開。また、BardからGeminiに改名された[42]

脚注

[編集]
  1. ^ グーグルが対話型AI「Bard」を一般公開、米国と英国で先行”. 日経クロステック (2023年3月22日). 2023年4月1日閲覧。
  2. ^ Dastin, Jeffrey、Dastin, Jeffrey「グーグル、対話型AIを「ジェミニ」に改名 有料の高性能版も」『Reuters』2024年2月9日。2024年2月16日閲覧。
  3. ^ Bard(バード)とは”. 日本経済新聞. 2023年4月1日閲覧。
  4. ^ a b Googleの対話型AI「Bard」が日本語に対応、最新のPaLM 2ベースに”. 日経クロステックlanguage=ja (2023年5月11日). 2023年5月12日閲覧。
  5. ^ Googleの生成AI「Bard」が日本語に対応、大規模言語モデル「PaLM 2」搭載”. INTERNET Watch. インプレス (2023年5月11日). 2023年6月15日閲覧。
  6. ^ GoogleのAI「Bard」、日本語で「Gemini Pro」と「G」ボタン対応 英語なら描画も可能に”. ITmedia NEWS (2024年2月2日). 2024年2月2日閲覧。
  7. ^ Nast, Condé (2023年3月21日). “グーグルが会話型AI「Bard」を一般公開、“ChatGPT対抗”を急ぐ事情と共通する弱点の中身”. WIRED.jp. 2023年4月1日閲覧。
  8. ^ グーグル、対話型AI搭載の検索サービス「バード」を開始”. 読売新聞オンライン (2023年3月22日). 2023年4月1日閲覧。
  9. ^ グーグル、自然な会話を実現する言語モデル「LaMDA」発表--高度な検索目指す「MUM」技術も”. ZDNet Japan (2021年5月19日). 2023年4月1日閲覧。
  10. ^ ChatGPT、月間アクティブユーザー数が1億人突破”. Gadget Gate. 2023年4月1日閲覧。
  11. ^ ChatGPTが「月間1億ユーザー」をわずか2カ月で達成し史上最も急速に成長していることが報告される”. GIGAZINE (2023年2月3日). 2023年4月1日閲覧。
  12. ^ 収益構造でFacebookは98%・Googleは81%を広告に依存しており脆弱性と化している”. GIGAZINE (2022年2月4日). 2023年4月1日閲覧。
  13. ^ 小久保重信 (2023年1月29日). “ついに5割切るGoogleとMetaのネット広告シェア、その要因探る”. Yahoo!ニュース. 2023年4月1日閲覧。
  14. ^ グーグル・メタを差し置いて、アマゾンの広告事業が伸び続ける3つの理由”. ITmedia ビジネスオンライン (2023年2月28日). 2023年4月1日閲覧。
  15. ^ Googleが発した厳戒「コードレッド」”. 日本経済新聞 (2023年3月18日). 2023年4月1日閲覧。
  16. ^ ChatGPTのリリースでGoogleは「コードレッド」を宣言、AIチャットボットが検索ビジネスにもたらす脅威に対応するためにチームを再割り当て”. GIGAZINE (2022年12月23日). 2023年4月18日閲覧。
  17. ^ グーグル創業者が数年ぶりに現場復帰、AI部門のテコ入れで”. Forbes JAPAN (2023年2月2日). 2023年4月18日閲覧。
  18. ^ 新しい Bing が OpenAI の GPT-4 上で稼働”. News Center Japan (2023年3月15日). 2023年4月1日閲覧。
  19. ^ Google、会話型AIサービス「Bard」を発表 ~近々正式リリースへ/検索とは異なるアプローチでユーザーを答えに導く”. 窓の杜 (2023年2月7日). 2023年4月1日閲覧。
  20. ^ GoogleのChatGPT競合「Bard」のデモ回答に誤り──天文学者らが指摘”. ITmedia NEWS (2023年2月9日). 2023年4月1日閲覧。
  21. ^ Google社員は「Bard」の性急すぎる発表に不満を抱いている”. GIGAZINE (2023年2月12日). 2023年4月1日閲覧。
  22. ^ Google、対話AIのBard一般公開 「自信満々に間違う」注記”. 日本経済新聞 (2023年3月22日). 2023年4月1日閲覧。
  23. ^ Roose, Kevi (2023年3月31日). “Google C.E.O. Sundar Pichai on the A.I. Moment: ‘You Will See Us Be Bold” (英語). ニューヨーク・タイムズ. ISSN 0362-4331. https://www.nytimes.com/2023/03/31/technology/google-pichai-ai.html 2023年4月20日閲覧。 
  24. ^ Pathwaysの恐るべき威力、ベールを脱いだグーグルの万能AIが目指す究極形とは”. 日経クロステック (2022年4月15日). 2023年4月20日閲覧。
  25. ^ グーグルCEO、「Bard」のアップデートを予告--現状は「チューンアップした大衆車」”. CNET Japan (2023年4月4日). 2023年4月20日閲覧。
  26. ^ 日本語の Bard でも Gemini Pro が利用可能に。 あわせて、回答を確認するダブルチェック機能も公開。”. Google Japan Blog (2024年2月2日). 2024年2月2日閲覧。
  27. ^ a b Googleのエンジニアが「ついにAIが実現した」「AIに意識が芽生えた」と訴える”. GIGAZINE (2022年6月13日). 2023年4月1日閲覧。
  28. ^ チャットAI「ChatGPT」のコンテンツフィルターを解除して「銃の作り方」などを回答させる方法が発見される”. GIGAZINE (2022年12月5日). 2023年6月15日閲覧。
  29. ^ 伊、チャットGPT禁止 欧米初、個人情報収集違反”. 産経デジタル (2023年4月1日). 2023年4月1日閲覧。
  30. ^ AI化が進めば「人類に深刻なリスク」、アメリカで開発停止求め署名運動…マスク氏ら賛同”. 読売新聞オンライン (2023年3月30日). 2023年4月1日閲覧。
  31. ^ AI開発停止要求署名は無意味、透明性と説明責任の改善を──Hugging Faceのルッチョーニ博士”. ITmedia NEWS (2023年4月5日). 2023年6月15日閲覧。
  32. ^ ChatGPT、欧州で規制強化検討へ イタリアがきっかけ”. 日経ビジネス (2023年4月5日). 2023年5月11日閲覧。
  33. ^ GoogleのAI「Bard」にBardの記事を書いてもらった。ChatGPTとの違いをメインに”. ギズモード (2023年3月27日). 2023年4月1日閲覧。
  34. ^ マイクロソフトが新しいAI機能発表、BingユーザーにGPT-4への無料アクセスを提供”. Cointelegraph (2023年5月5日). 2023年6月15日閲覧。
  35. ^ Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み”. GIGAZINE (2023年5月11日). 2023年5月11日閲覧。
  36. ^ グーグル、AI搭載した新たな検索エンジン「SGE」を発表”. CNET Japan (2023年5月11日). 2023年5月11日閲覧。
  37. ^ 「Google Workspace」に生成AI搭載へ 文章からスライド用の画像生成、スプレッドシートでリスト作成など”. ITmedia NEWS (2023年5月11日). 2023年5月11日閲覧。
  38. ^ Googleの生成AI「Bard」が「Google Workspace」からも利用可能に ~管理者がON/OFF可能/デフォルトの値はOFF。ドメイン・組織単位・グループごとに有効化できる”. 窓の杜 (2023年5月8日). 2023年5月11日閲覧。
  39. ^ まさかの組み合わせ。GoogleのAI 「Bard」、画像生成AI「Adobe Firefly」とパートナーに #GoogleIO”. ギズモード (2023年5月11日). 2023年5月11日閲覧。
  40. ^ 日本からGoogleのAI「Bard」のベータテストに参加できるようになりました!【追記あり】”. ギズモード (2023年4月18日). 2023年4月18日閲覧。
  41. ^ a b c d Bard” (英語). bard.google.com. 2023年7月13日閲覧。
  42. ^ グーグルBard、「Gemini」に生まれ変わる 最上位AIモデルは月2900円”. Impress Watch (2023年2月8日). 2024年2月11日閲覧。

外部リンク

[編集]