DeepSeek V4 dévoile : Danger pour la programmation GPT/Claude pendant le Nouvel An chinois

量子位2026/01/10 01:37

Afficher le texte d'origine

Par:量子位

🧨À l’approche du Nouvel An chinois, cette année DeepSeek va encore une fois impressionner le monde🧨📄Selon The Information, deux personnes bien informées directement impliquées dans ce projet ont révélé que DeepSeek publiera la V4 autour de la mi-février, juste avant ou après le Nouvel An chinois, la date pouvant encore être ajustée.💪DeepSeek-V4 met en avant ses capacités en codage ; les premiers résultats des tests internes indiquent qu’il a déjà surpassé Claude d’Anthropic, la série GPT d’OpenAI et d’autres modèles existants.Les deux sources ont également ajouté que les avancées majeures de la V4 se manifestent dans deux domaines :1️⃣ Une percée clé dans le traitement et l’analyse des prompts de code ultra-long.2️⃣ Durant toutes les phases du processus d’entraînement, la capacité de compréhension des schémas de données ne subit aucune dégradation de performance, avec une amélioration significative par rapport à la génération précédente.PS : Pendant la formation d’un modèle d’IA, celui-ci doit apprendre à partir de vastes ensembles de données de manière répétée. Mais en pratique, plus les cycles d’entraînement augmentent, plus la capacité du modèle à détecter les schémas de données a tendance à diminuer. Pour les développeurs disposant d’importantes réserves de puces IA, la solution classique consiste à augmenter les cycles d’entraînement pour compenser la perte de performance.🧐Il est probable que les utilisateurs remarqueront, lors de l’utilisation réelle, que les réponses générées par la V4 sont plus logiques et structurées. Cela indique que le modèle possède de meilleures capacités de raisonnement profond et que sa fiabilité dans le traitement de tâches complexes sera grandement améliorée.À noter, certains internautes ont observé que dans l’article sur DeepSeek-V3.2, il était mentionné qu’ils utilisaient la plateforme Arena des grands modèles (ChatbotArena) pour l’évaluation des préférences humaines.Ainsi, il se pourrait que nous puissions tester ce modèle encore plus tôt sur la plateforme Arena des grands modèles.

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens

Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.

Bloquez maintenant !