百度 ERNIE 5 AI 模型排名上升——數學天才超越 OpenAI GPT 5.1

Bitget

資訊中心

Decrypt2026/01/15 21:36

顯示原文

作者:Decrypt

重點簡述

百度全新 ERNIE 5.0 躋身全球頂尖 AI 模型之列，在 LMArena 上超越 GPT-5.1，數學任務排名全球第二。
ERNIE v4 版本於兩年前發布。
在激烈的國內競爭中，強勁的企業採用彌補了百度消費級 AI 業務的挫折。

中國科技巨頭百度剛剛更新了其最先進的 AI 模型——而且表現相當不錯。

該公司 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1,460 分，排名全球第 8，成為唯一進入該平台前 10 的中國模型。它超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 於 2023 年發布。

ERNIE 5.0 在數學推理方面也位居全球第二，僅次於尚未發布的 GPT-5.2-High。中國模型能在複雜邏輯任務上超越幾乎所有公開可用的西方系統，標誌著 AI 實力差距的顯著變化——或說正在縮小。

沒錯，數學全球第二讓 ernie 進入了完全不同的討論層次。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度在 X 上的公告強調，ERNIE 5.0 已正式結束預覽階段。該模型在創意寫作、指令跟隨及程式碼生成等方面也表現出色——在科學、商業與金融、醫療健康等多個職業領域均進入前 10 名。

🚨 快訊：@Baidu_inc 的 ERNIE-5.0-0110 剛剛在 LMArena 上取得了令人印象深刻的成績。這不是測試版或預覽版。

在最新排名中，該模型在文本基準測試獲得 1460 分，成為中國模型第一，並躋身全球前十——唯一一個中國… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

這些成果背後的技術架構體現了中國對效率而非單純算力的重視。ERNIE 5.0 採用約 2 兆參數的 Mixture-of-Experts 架構，每次推理僅啟用極少部分專家（準確來說只有 3%）。

如同其他稀疏前沿模型，這種設計相較於密集系統能減少每次查詢的運算量，儘管會帶來更多工程複雜性。百度還表示，ERNIE 5.0 是從文本、圖像、音訊、視頻等多模態原生訓練，而非在語言基礎上外掛多模態模組。公司稱這使 Ernie 成為原生的「全模態」AI模型。

這次強勢回歸值得關注，畢竟百度曾一度落後。今年 11 月，ERNIE 5.0 預覽版本在 LMArena 上僅排第 24 名。國內 AI 市場則被反應更靈敏的競爭對手主導：字節跳動的豆包月活用戶達 1.01 億，而 DeepSeek 的高性價比模型引發價格戰，迫使百度於去年 4 月全面放棄付費訂閱模式。

但消費業務的困境並未拖慢百度的企業級發展。ERNIE 現已為中國各地智慧城市指揮中心提供動力，服務於所有系統性重要銀行，每日處理 165 億次 API 請求。這一 B2B 優勢讓百度免受殘酷消費市場競爭衝擊，同時也持續為模型研發提供資金。

除了大模型本身的運算能力外，ERNIE 聊天機器人的用戶介面也非常友好，且內建多種自定義功能，讓用戶能依需求獲得更貼切的結果。例如，系統不會讓用戶自行輸入複雜指令，而是針對寫作、閱讀、圖像編輯和一般用途分設不同區塊。雖然底層是同一模型，但系統提示和微調的差異讓每項任務都更易完成。