重點簡述

  • 百度全新 ERNIE 5.0 躋身全球頂尖 AI 模型之列,在 LMArena 上超越 GPT-5.1,數學任務排名全球第二。
  • ERNIE v4 版本於兩年前發布。
  • 在激烈的國內競爭中,強勁的企業採用彌補了百度消費級 AI 業務的挫折。

中國科技巨頭百度剛剛更新了其最先進的 AI 模型——而且表現相當不錯。

該公司 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1,460 分,排名全球第 8,成為唯一進入該平台前 10 的中國模型。它超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 於 2023 年發布。

ERNIE 5.0 在數學推理方面也位居全球第二,僅次於尚未發布的 GPT-5.2-High。中國模型能在複雜邏輯任務上超越幾乎所有公開可用的西方系統,標誌著 AI 實力差距的顯著變化——或說正在縮小。

沒錯,數學全球第二讓 ernie 進入了完全不同的討論層次。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度在 X 上的公告強調,ERNIE 5.0 已正式結束預覽階段。該模型在創意寫作、指令跟隨及程式碼生成等方面也表現出色——在科學、商業與金融、醫療健康等多個職業領域均進入前 10 名。

🚨 快訊:@Baidu_inc 的 ERNIE-5.0-0110 剛剛在 LMArena 上取得了令人印象深刻的成績。這不是測試版或預覽版。

在最新排名中,該模型在文本基準測試獲得 1460 分,成為中國模型第一,並躋身全球前十——唯一一個中國… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

這些成果背後的技術架構體現了中國對效率而非單純算力的重視。ERNIE 5.0 採用約 2 兆參數的 Mixture-of-Experts 架構,每次推理僅啟用極少部分專家(準確來說只有 3%)。

如同其他稀疏前沿模型,這種設計相較於密集系統能減少每次查詢的運算量,儘管會帶來更多工程複雜性。百度還表示,ERNIE 5.0 是從文本、圖像、音訊、視頻等多模態原生訓練,而非在語言基礎上外掛多模態模組。公司稱這使 Ernie 成為原生的「全模態」AI模型。

這次強勢回歸值得關注,畢竟百度曾一度落後。今年 11 月,ERNIE 5.0 預覽版本在 LMArena 上僅排第 24 名。國內 AI 市場則被反應更靈敏的競爭對手主導:字節跳動的豆包月活用戶達 1.01 億,而 DeepSeek 的高性價比模型引發價格戰,迫使百度於去年 4 月全面放棄付費訂閱模式。

但消費業務的困境並未拖慢百度的企業級發展。ERNIE 現已為中國各地智慧城市指揮中心提供動力,服務於所有系統性重要銀行,每日處理 165 億次 API 請求。這一 B2B 優勢讓百度免受殘酷消費市場競爭衝擊,同時也持續為模型研發提供資金。

除了大模型本身的運算能力外,ERNIE 聊天機器人的用戶介面也非常友好,且內建多種自定義功能,讓用戶能依需求獲得更貼切的結果。例如,系統不會讓用戶自行輸入複雜指令,而是針對寫作、閱讀、圖像編輯和一般用途分設不同區塊。雖然底層是同一模型,但系統提示和微調的差異讓每項任務都更易完成。

百度 ERNIE 5 AI 模型排名上升——數學天才超越 OpenAI GPT 5.1 image 0

有趣的是,最新版本並未開啟網路搜索功能,因此完全離線。不過,用戶可切換回先前的 Ernie 4.5,並啟用網路搜索以獲取最新資訊。

市場反應不一,有用戶仍在等待更詳盡的模型表現與基準測試數據,百度承諾將很快公布。同時也需注意,雖然 ERNIE 5.0 在部分基準上可媲美 GPT-5 與 Gemini 2.5,但西方多數實驗室已進入 GPT-5.2 或 Gemini 3,這更像是在追趕,而非領先。