GoogleのGemini1.0は性能比較テストで、GPT-4 を上回る結果を発表した

Gemini1.0の開発者であるGoogle DeepMindについて

Google(グーグル)は、Google BrainとDeepMindを 1 つのチームに統合して新たに「Google DeepMind」を新設すると発表しました。これらのチームのインサイドストーリーを見てみましょう。

Google Brainは2011 年に設立され、Google 翻訳や、TensorFlow(テンソルフロー)などのプロジェクトに貢献する深層学習(ディープラーニング)プラットフォームです。TensorFlowは、誰もが機械学習モデルをトレーニングできるオープンソースソフトウェアライブラリです。

DeepMind は 2010 年に設立され、2014年にGoogleによって買収されました。DeepMindはAlphaGo(深層強化学習)など、いくつかの重要なプロジェクトに取り組んでいました。

Googleおよびアルファベット(Alphabet)のCEOを務めるスンダー・ピチャイ(Sundar Pichai)氏は、「2つのAI研究チームの組み合わせにより、AIの効率と進歩が大幅に加速されるでしょう。」と述べました。同氏はGoogle DeepMindのCEOであるデミス・ハサビスにも言及し、「彼は新しい能力を持ち、AIセキュリティに関して担当するAI開発チームを率いるでしょう」と述べました。

Geminiとは?

Gemini は、Google DeepMindの最大かつ最も有能なAIモデルです。

Google Gemini 1.0

Geminiは、テキスト、コード、音声、画像、ビデオなど、様々なタイプの入力データをサポートします。これは最も柔軟なモデルであり、つまり、大規模なデータセンターからスマートフォンのようなモバイルデバイスに至るまで効率的に実行できることを意味します。Googleは、Geminiの能力を紹介するデモビデオを公開しました。

このビデオでは、絵を描いたり、Geminiに何を見ているか尋ねたりすることによって、人間とGeminiの相互作用が表示されています。

これは、Geminiが詳細な知識を持ち、絵を正確に説明し、テキストと音声の両方を自然に表現できることを示しています。

絵に加えて、テスターが物体を取ってそれを絵と比較すると、Geminiは自然に驚きを表現し、テスターが取った物体が何であるか正確に予測することができます。さらに、その物体を他の言語で発音することもできます。

ビデオの始まりを見ただけで、とても興味深いです。但し、Geminiの能力はそこで終わりません。Geminiは、ゲームの答えや解決策を備えたゲームを作成することもできます。これらはビデオのほんの一部です。最後まで見た人は、Geminiの能力に驚くでしょう。

Geminiの最初のリリースは、3つの異なるモデルで利用可能になります。

3 models of Gemini
  1. Gemini Ultra: 非常に複雑なタスクに対応する最大かつ最も有能なモデルです。
  2. Gemini Pro: 幅広いタスクにスケーリングするための最高な中規模のモデルです。
  3. Gemini Nano: 最も効率的なモデルは、スマートフォンなどのデバイス上で実行されるように設計されています。Google Pixel 8 Proは、Gemini Nanoを使用できる最初のスマートフォンです。

Gemini Ultraのテスト結果は、ほぼ全ての側面でGPT-4を上回っています。

OpenAIのGPT-4とGoogleのGemini Ultraの結果を比較すると、GeminiはいくつかのベンチマークでGPT-4 を上回っています。例えば、Gemini Ultraは、MMLU (大規模なマルチタスク言語理解の測定) 、つまり一連の知識と言語理解の質問で90%のスコアを獲得しましたが、GPT-4は86.4%のスコアを獲得しました。

さらに、Geminiは数学とコーディングのテストでもGPT-4を上回っています。

Gemini Ultra comparing with GPT-4

Gemini は、画像、ビデオ、および音声データの理解に関するほぼ全てのテストトピックで 、GPT-4 よりも高いスコアを獲得しています。

Gemini comparing with GPT-4V

現在、GoogleはGoogle製品を通じて170ヶ国以上の人々に英語版の Gemini 1.0 を提供しており、近い将来、他の言語もサポートする予定です。

準備をしましょう。Gemini Ultraはもうすぐ登場します。

Google は Gemini Ultra のセキュリティと信頼性をテストしており、一般の開発者や企業に展開する前に、早期の実験とフィードバックのために、選択された顧客、開発者、パートナー、セキュリティ専門家に間もなく提供される予定です。

まとめ

AI と機械学習は継続的に進化しているため、Gemini 1.0 のようなAI チャットボットの能力が人間のタスクに間違いなく役立つことがわかります。なぜなら、Geminiは自然に人間と対話し、人間の知識と能力を超える知識を持っているからです。そして、Geminiは大規模なデータソースもあり、情報を完全に処理することができます。将来的には、さらに知能の高いAIが登場する可能性が高く、多くの方法で人間に恩恵をもたらすことが予想されます。

参照元:

https://deepmind.google/about/

https://deepmind.google/technologies/gemini/#introduction

https://blog.google/technology/ai/google-gemini-ai/?utm_source=gdm&utm_medium=referral#sundar-note

https://goo.gle/GeminiPaper

イメージ: Freepik