GoogleのDeep Think搭載の高度なGeminiモデルが、人間レベルの問題解決能力で国際数学オリンピックで金メダルを獲得
簡単に言えば Google DeepMind の Gemini AI モデルの高度なバージョンは、国際数学オリンピックで 6 つの問題のうち 5 つを解き、金メダルレベルのパフォーマンスを達成しました。これは、人間レベルの数学的推論における AI の大きなマイルストーンとなりました。
Googleの人工知能部門は、 Google DeepMind 同社は、ジェミニ・ディープシンクモデルの改良版が国際数学オリンピック(IMO)で35問中XNUMX問を解き、金メダル相当のXNUMXポイントを獲得したと発表した。これは、IMOのコーディネーターが人間の参加者に適用されるのと同じ基準を用いてモデルの結果を公式に評価・認定した初の事例の一つとなった。
このデモンストレーションに使用されたジェミニディープシンクシステム featured 複雑な数学問題に対応する強化された推論能力。並列思考と呼ばれる手法を含む最近の研究開発が組み込まれており、これによりモデルは単一の線形プロセスに従うのではなく、最終的な答えに到達する前に複数の解の経路を同時に探索・統合することが可能になります。
パフォーマンス向上のため、モデルは多段階推論、定理証明、そして一般的な問題解決能力を強化するよう設計された強化学習技術を用いて訓練されました。また、システムは厳選された高品質な数学的解答セットと、IMO形式の問題へのアプローチ方法に関する指導ガイダンスにアクセスしました。
この Deep Think モデルの限定バージョンは、Google AI Ultra 加入者への広範なリリースに先立ち、数学者を含む選ばれたテスターと共有されます。
この開発は、昨年の成果を大きく上回る大きな進歩です。2024年には、AlphaGeometryやAlphaProofのようなモデルは、問題をドメイン固有言語(Leanなど)に翻訳し、またその逆を行うために人間の介入が必要でした。さらに、問題の解決には数日間の計算を要していました。対照的に、更新されたモデルは、 ジェミニモデル 公式の IMO 問題ステートメントから、完全に自然言語で、標準的な 4.5 時間の競技時間枠内で、数学的に厳密なソリューションを直接生成しました。
IMOは高度な数学的推論におけるAIの重要なベンチマークとなる
IMOは、大学進学前の優秀な生徒が集まり、代数、組合せ論、幾何学、数論といった分野にわたる1959つの高度な数学問題に取り組む、長年続く世界規模のコンテストです。50年に設立されたIMOは、世界で最も難しい数学コンテストの一つとして広く知られています。参加各国は8人の生徒からなるチームを編成し、上位XNUMX%の参加者にメダルが授与され、そのうち約XNUMX%が金メダルを獲得します。
近年、このコンテストは、複雑な問題解決と数学的推論における人工知能の能力を評価するベンチマークとしても注目を集めています。2024年には、Google DeepMindのAlphaProofとAlphaGeometry 2を組み合わせたシステムが、28問中XNUMX問を解き、XNUMXポイントを獲得し、シルバーレベルの成績を達成しました。形式的な数学言語を用いたこの結果は、AIが人間の高度な数学的スキルに匹敵する可能性を示す上で、大きな前進となりました。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
[新規上場] BitgetがDePHY(PHY)を上場!参加して6,600,000 PHYの山分けを獲得しよう
Bitget Trading Club Championship(フェーズ1)- 毎日現物取引を行い、50,000 BGBを山分けしよう
先物取引と取引BotにSLPUSDTが登場
先物取引と取引BotにPENGUPERPが登場
トレンド
もっと見る暗号資産価格
もっと見る








