Bitget App
交易「智」變
快速買幣市場交易合約理財廣場更多
DeepSeek發布梁文鋒署名新論文:提出mHC新架構提升大模型訓練穩定性

DeepSeek發布梁文鋒署名新論文:提出mHC新架構提升大模型訓練穩定性

PANewsPANews2026/01/01 09:39
顯示原文

PANews 1月1日訊息,據Golden Ten Data報導,DeepSeek發表新論文,提出一種名為流形約束超連接(mHC)的新架構,旨在解決超連接網絡(HC)技術因破壞恆等映射特性而導致的訓練不穩定及可擴展性受限等問題。該架構通過將HC的殘差連接空間映射至特定流形以恢復恆等映射特性,同時結合嚴格的基礎設施優化以確保效率,實現了顯著的性能改進和優越的可擴展性。DeepSeek預計,mHC作為HC的一種靈活實用擴展,將有助於更深入理解拓撲架構設計,並為基座模型的演進指明有前景的方向。該論文由Zhenda Xie(解振達)、Yixuan Wei(韋毅軒)、Huanqi Cao共同擔任第一作者,梁文鋒亦在作者名單之中。

0
0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與
© 2025 Bitget