重點簡述
- 百度全新 ERNIE 5.0 躋身全球頂尖 AI 模型之列,在 LMArena 上超越 GPT-5.1,數學任務排名全球第二。
- ERNIE v4 版本於兩年前發布。
- 在激烈的國內競爭中,強勁的企業採用彌補了百度消費級 AI 業務的挫折。
中國科技巨頭百度剛剛更新了其最先進的 AI 模型——而且表現相當不錯。
該公司 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1,460 分,排名全球第 8,成為唯一進入該平台前 10 的中國模型。它超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 於 2023 年發布。
ERNIE 5.0 在數學推理方面也位居全球第二,僅次於尚未發布的 GPT-5.2-High。中國模型能在複雜邏輯任務上超越幾乎所有公開可用的西方系統,標誌著 AI 實力差距的顯著變化——或說正在縮小。
沒錯,數學全球第二讓 ernie 進入了完全不同的討論層次。
— Muhammad Ayan (@socialwithaayan) 2026年1月15日
百度在 X 上的公告強調,ERNIE 5.0 已正式結束預覽階段。該模型在創意寫作、指令跟隨及程式碼生成等方面也表現出色——在科學、商業與金融、醫療健康等多個職業領域均進入前 10 名。
這些成果背後的技術架構體現了中國對效率而非單純算力的重視。ERNIE 5.0 採用約 2 兆參數的 Mixture-of-Experts 架構,每次推理僅啟用極少部分專家(準確來說只有 3%)。
如同其他稀疏前沿模型,這種設計相較於密集系統能減少每次查詢的運算量,儘管會帶來更多工程複雜性。百度還表示,ERNIE 5.0 是從文本、圖像、音訊、視頻等多模態原生訓練,而非在語言基礎上外掛多模態模組。公司稱這使 Ernie 成為原生的「全模態」AI模型。
這次強勢回歸值得關注,畢竟百度曾一度落後。今年 11 月,ERNIE 5.0 預覽版本在 LMArena 上僅排第 24 名。國內 AI 市場則被反應更靈敏的競爭對手主導:字節跳動的豆包月活用戶達 1.01 億,而 DeepSeek 的高性價比模型引發價格戰,迫使百度於去年 4 月全面放棄付費訂閱模式。
但消費業務的困境並未拖慢百度的企業級發展。ERNIE 現已為中國各地智慧城市指揮中心提供動力,服務於所有系統性重要銀行,每日處理 165 億次 API 請求。這一 B2B 優勢讓百度免受殘酷消費市場競爭衝擊,同時也持續為模型研發提供資金。
除了大模型本身的運算能力外,ERNIE 聊天機器人的用戶介面也非常友好,且內建多種自定義功能,讓用戶能依需求獲得更貼切的結果。例如,系統不會讓用戶自行輸入複雜指令,而是針對寫作、閱讀、圖像編輯和一般用途分設不同區塊。雖然底層是同一模型,但系統提示和微調的差異讓每項任務都更易完成。
有趣的是,最新版本並未開啟網路搜索功能,因此完全離線。不過,用戶可切換回先前的 Ernie 4.5,並啟用網路搜索以獲取最新資訊。
市場反應不一,有用戶仍在等待更詳盡的模型表現與基準測試數據,百度承諾將很快公布。同時也需注意,雖然 ERNIE 5.0 在部分基準上可媲美 GPT-5 與 Gemini 2.5,但西方多數實驗室已進入 GPT-5.2 或 Gemini 3,這更像是在追趕,而非領先。