Bitget App
スマートな取引を実現
暗号資産を購入市場取引先物Bitget Earn広場もっと見る
アリババがより効率的なQwen3-Next人工知能モデルを発表

アリババがより効率的なQwen3-Next人工知能モデルを発表

金色财经金色财经2025/09/11 22:32
原文を表示

Jinse Financeによると、Alibaba傘下のTongyi Qianwenは次世代基盤モデルアーキテクチャ「Qwen3-Next」を発表し、このアーキテクチャに基づく「Qwen3-Next-80B-A3B」シリーズモデルをオープンソース化しました。この構造はQwen3のMoEモデル構造と比較して、以下のコア改良が行われています:ハイブリッドアテンションメカニズム、高スパースMoE構造、一連のトレーニング安定性に優れた最適化、そして推論効率を向上させるマルチトークン予測メカニズムです。Qwen3-Nextのモデル構造に基づき、Alibabaは「Qwen3-Next-80B-A3B-Base」モデルをトレーニングしました。このモデルは800億(80 billions)パラメータを持ちながら、実際にアクティブになるのは30億(3 billions)パラメータのみです。このBaseモデルはQwen3-32Bのデンスモデルと同等かそれ以上の性能を実現しつつ、トレーニングコスト(GPU hours)はQwen3-32Bの10分の1以下、32k以上のコンテキストでの推論スループットはQwen3-32Bの10倍以上となり、極めて高いトレーニングおよび推論コストパフォーマンスを実現しています。

0

免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット
最大12%のAPR!エアドロップを継続的に獲得しましょう!
今すぐロック