DeepSeek V3.2 version officielle publiée : capacités d’Agent renforcées, intégration de la réflexion et du raisonnement

金色财经2025/12/01 11:26

Afficher le texte d'origine

Jinse Finance rapporte qu'aujourd'hui, nous publions simultanément deux modèles en version officielle : DeepSeek-V3.2 et DeepSeek-V3.2-Speciale. DeepSeek-V3.2 est notre premier modèle intégrant la réflexion dans l'utilisation des outils, tout en prenant en charge à la fois le mode réflexion et le mode non-réflexion pour l'appel d'outils. Nous avons proposé une méthode de synthèse de données d'entraînement à grande échelle pour les Agents, construisant un grand nombre de tâches de renforcement « difficiles à résoudre, faciles à vérifier » (plus de 1800 environnements, plus de 85 000 instructions complexes), ce qui a considérablement amélioré la capacité de généralisation du modèle. (DeepSeek)

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens

Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.

Bloquez maintenant !

Vous pourriez également aimer

Le Stellar Community Fund annonce une mise à niveau et ajuste l’optimisation de la méthode d’allocation des fonds.

Odaily星球日报•2026/01/17 08:47

Point de vue : la DeFi basée sur les incitations disparaîtra d'ici 2026

Odaily星球日报•2026/01/17 08:37

L’analyste : La pression de vente actuelle sur le marché du bitcoin provient principalement des détenteurs en profit, et si le prix continue d’augmenter, il sera confronté à la pression de vente des détenteurs en perte.

BlockBeats•2026/01/17 08:34

QNT dépasse 85 dollars, avec une hausse de 15,09 % en 24 heures

金色财经•2026/01/17 08:19