概要
- Baiduの新しいERNIE 5.0は、LMArenaでGPT-5.1を上回り、数学タスクで世界第2位となるなど、世界最高のAIモデルの一つに選ばれました。
- ERNIEのv4バージョンは2年前にリリースされました。
- 激しい国内競争の中、エンタープライズ向けの採用がBaiduの消費者向けAIの苦戦を相殺しています。
中国のテック大手Baiduは、最新鋭のAIモデルをアップデートしました——そして、その性能はかなり優れているようです。
同社のERNIE-5.0-0110は、LMArenaのテキストリーダーボードで1,460ポイントを獲得し、世界8位となり、中国のモデルとして唯一トップ10入りを果たしました。OpenAIのGPT-5.1-HighやGoogleのGemini-2.5-Proを上回っています。ERNIE v4.0は2023年にリリースされました。
ERNIE 5.0はまた、数学的推論で世界第2位となり、未公開のGPT-5.2-Highのみに遅れをとりました。中国のモデルが複雑な論理タスクでほとんどの公開されている西洋のシステムを上回ったことは、AI能力格差の大きな変化——もしくはその縮小——を示しています。
そうですね、数学で世界2位ということは、ernieが全く異なる議論の対象になっています。
— Muhammad Ayan (@socialwithaayan) 2026年1月15日
BaiduはXでの発表で、ERNIE 5.0が正式にプレビュー段階を終了したことを強調しました。またこのモデルは、クリエイティブライティング、指示の理解、コーディングなどでも競争力のあるパフォーマンスを発揮しており、科学、ビジネス・金融、ヘルスケアなど複数の職業分野でトップ10にランクインしています。
これらの成果を支える技術的アーキテクチャは、中国が重視する効率性を優先したものです。ERNIE 5.0は、約2兆パラメータのMixture-of-Expertsアーキテクチャを採用しており、推論ごとにごく一部のエキスパート(正確にはわずか3%)のみを活性化しています。
他のスパースフロンティアモデル同様、この設計により、密なシステムと比べて1クエリごとの計算量が削減される一方で、エンジニアリングの複雑さは増します。Baiduはまた、ERNIE 5.0がテキスト、画像、音声、動画すべてをネイティブに学習しており、言語専用コアにマルチモーダルモジュールを後付けしていないと述べています。これによりErnieは本質的に“オムニモーダル”なAIモデルとなっています。
Baiduがいかに苦境から回復したかを考えると、この復活は注目に値します。11月には、ERNIE 5.0のプレビューバージョンがLMArenaで24位まで順位を落としていました。国内AI市場は、より機敏な競合他社が支配しており、ByteDanceのDoubaoは月間アクティブユーザーが1億100万人に達し、DeepSeekのコスト効率に優れたモデルが価格競争を引き起こし、Baiduは今年4月に有料サブスクリプションモデルを完全に放棄することを余儀なくされました。
しかし、消費者向けの苦戦にもかかわらず、Baiduのエンタープライズ分野での勢いは衰えていません。ERNIEは現在、中国全土のスマートシティ指令センターに導入されており、すべてのシステム上重要な中国の銀行で利用され、1日あたり165億件のAPIコールを処理しています。このB2Bの強固な基盤が、Baiduを消費者向けの熾烈な競争から守り、モデル開発の継続的な資金源となっています。
LLMの純粋なパワーだけでなく、ERNIEチャットボットのUIは非常にユーザーフレンドリーで、ユーザーのニーズに合わせたカスタマイズ機能が豊富に備わっています。例えば、異なるタスクのために複雑なプロンプトを入力させる代わりに、チャットボットはライティング、リーディング、画像編集、一般利用など用途ごとにセクションを分けています。同じコアモデルでありながら、システムプロンプトや微調整で各タスクが簡単にこなせるようになっています。
興味深いことに、最新バージョンではウェブ検索機能が搭載されておらず、完全にオフラインで動作します。ただし、ユーザーは前バージョンのErnie 4.5に切り替えることで、ウェブ検索機能付きで最新情報を取得可能です。
反応は様々で、モデルのパフォーマンスやベンチマークのより詳細な内訳を待つユーザーもおり、同社は近日中に公開すると約束しています。また、ERNIE 5.0が特定のベンチマークでGPT-5やGemini 2.5に匹敵する一方で、多くの西洋の研究所はすでにGPT-5.2やGemini 3に移行しているため、今回の成果は追いつきであり、先行ではないという点も重要です。