Alibaba lance un modèle d'intelligence artificielle Qwen3-Next plus performant

Bitget App

Trade smarter

Bitget

Actualités

金色财经2025/09/11 22:32

Afficher le texte d'origine

Selon un rapport de Jinse Finance, Tongyi Qianwen, filiale d'Alibaba, a publié la nouvelle architecture de modèle de base Qwen3-Next et a open-sourcé la série de modèles Qwen3-Next-80B-A3B basée sur cette architecture. Par rapport à la structure MoE du Qwen3, cette nouvelle architecture apporte les améliorations clés suivantes : un mécanisme d'attention hybride, une structure MoE à haute sparsité, une série d'optimisations favorisant la stabilité de l'entraînement, ainsi qu'un mécanisme de prédiction multi-token améliorant l'efficacité de l'inférence. Basé sur la structure du modèle Qwen3-Next, Alibaba a entraîné le modèle Qwen3-Next-80B-A3B-Base, qui possède 80 milliards de paramètres tout en n'activant que 3 milliards de paramètres. Ce modèle de base atteint des performances similaires, voire légèrement supérieures, à celles du modèle dense Qwen3-32B, tout en nécessitant moins d'un dixième du coût d'entraînement (en heures GPU) du Qwen3-32B. De plus, pour des contextes supérieurs à 32k, le débit d'inférence est plus de dix fois supérieur à celui du Qwen3-32B, réalisant ainsi un rapport coût-efficacité optimal pour l'entraînement et l'inférence.

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens

Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.

Bloquez maintenant !

Vous pourriez également aimer

La baleine interne "1011" a clôturé une position short de 5x sur 5 000 ETH, réalisant un bénéfice d'environ 55 000 dollars.

Chaincatcher•2025/11/30 01:24

Une adresse ETH 1CO transfère près de 120 millions de dollars d’ETH vers un nouveau portefeuille après 10 ans

Chaincatcher•2025/11/30 00:31

La Fondation caritative AB continue de promouvoir l'éducation et l'aide au Timor-Leste : don de 500 000 dollars en bourses et de biens d'une valeur équivalente à 691 412 dollars pour soutenir les enfants défavorisés.

金色财经•2025/11/29 23:44

Un trader a commencé à prendre des positions longues avec un effet de levier de 5x sur ETH et HYPE, avec une position totale d’environ 36 millions de dollars.

金色财经•2025/11/29 22:53

En vogue

Plus

Le fondateur de Monad : Les récents commentaires d'Arthur Hayes sur Monad ont été sortis de leur contexte, je serais ravi d'offrir quelques tokens MON pour une expérience utilisateur.

L'indice de peur et de cupidité d'aujourd'hui reste à 28, indiquant un niveau de peur.