DeepSeek V3.2 version officielle publiée : capacités d’Agent renforcées, intégration de la réflexion et du raisonnement
Jinse Finance rapporte qu'aujourd'hui, nous publions simultanément deux modèles en version officielle : DeepSeek-V3.2 et DeepSeek-V3.2-Speciale. DeepSeek-V3.2 est notre premier modèle intégrant la réflexion dans l'utilisation des outils, tout en prenant en charge à la fois le mode réflexion et le mode non-réflexion pour l'appel d'outils. Nous avons proposé une méthode de synthèse de données d'entraînement à grande échelle pour les Agents, construisant un grand nombre de tâches de renforcement « difficiles à résoudre, faciles à vérifier » (plus de 1800 environnements, plus de 85 000 instructions complexes), ce qui a considérablement amélioré la capacité de généralisation du modèle. (DeepSeek)
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
Point de vue : la DeFi basée sur les incitations disparaîtra d'ici 2026
QNT dépasse 85 dollars, avec une hausse de 15,09 % en 24 heures
