アリババがより効率的なQwen3-Next人工知能モデルを発表
Jinse Financeによると、Alibaba傘下のTongyi Qianwenは次世代基盤モデルアーキテクチャ「Qwen3-Next」を発表し、このアーキテクチャに基づく「Qwen3-Next-80B-A3B」シリーズモデルをオープンソース化しました。この構造はQwen3のMoEモデル構造と比較して、以下のコア改良が行われています:ハイブリッドアテンションメカニズム、高スパースMoE構造、一連のトレーニング安定性に優れた最適化、そして推論効率を向上させるマルチトークン予測メカニズムです。Qwen3-Nextのモデル構造に基づき、Alibabaは「Qwen3-Next-80B-A3B-Base」モデルをトレーニングしました。このモデルは800億(80 billions)パラメータを持ちながら、実際にアクティブになるのは30億(3 billions)パラメータのみです。このBaseモデルはQwen3-32Bのデンスモデルと同等かそれ以上の性能を実現しつつ、トレーニングコスト(GPU hours)はQwen3-32Bの10分の1以下、32k以上のコンテキストでの推論スループットはQwen3-32Bの10倍以上となり、極めて高いトレーニングおよび推論コストパフォーマンスを実現しています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
データ:Bitwise BSOL Solana ETFは過去1時間で93,000枚のSOLを追加保有
データ:ステーブルコインの流通時価総額が再び3050億ドルに回復、過去には0.8%の増加
S&P500先物は0.2%上昇
米国株式市場はCME(シカゴ・マーカンタイル取引所)システムの障害により、オープニングで混乱が予想される
