Bitget App
Trading Inteligente
Comprar criptoMercadosTradingFuturosEarnCentroMás
DeepSeek V4 revela: crisis de programación de GPT/Claude durante el Año Nuevo Chino

DeepSeek V4 revela: crisis de programación de GPT/Claude durante el Año Nuevo Chino

量子位量子位2026/01/10 01:37
Mostrar el original
Por:量子位
🧨Se acerca el Año Nuevo Chino y este año DeepSeek está a punto de sorprender al mundo nuevamente🧨📄Según información de medios internacionales como The Information, dos personas con conocimiento directo del plan revelaron que DeepSeek lanzará la V4 a mediados de febrero, alrededor del Año Nuevo Chino, aunque la fecha podría ajustarse.💪DeepSeek-V4 se destaca por su capacidad de codificación; los resultados preliminares de las pruebas internas muestran que ya ha superado a modelos existentes como Claude de Anthropic y la serie GPT de OpenAI.Las dos fuentes también agregaron que las innovaciones clave de la V4 se reflejan en dos aspectos:1️⃣ Logró avances fundamentales en el procesamiento y análisis de prompts de código extremadamente largos.2️⃣ Durante todas las etapas del proceso de entrenamiento, la capacidad de comprensión de patrones de datos no mostró deterioro en el rendimiento, y presenta una mejora significativa respecto a las versiones anteriores.PD: El proceso de entrenamiento de modelos de IA exige que el modelo aprenda repetidamente de conjuntos de datos masivos. Sin embargo, en la práctica, a medida que aumentan las rondas de entrenamiento, la capacidad del modelo para captar patrones de datos suele disminuir. Para los desarrolladores con grandes reservas de chips de IA, la forma habitual de abordar este problema es aumentar las rondas de entrenamiento para compensar la pérdida de rendimiento.🧐Es muy probable que los usuarios noten en el uso real que las respuestas generadas por la V4 tienen una lógica más clara y una estructura mejor organizada. Esto indica que el modelo posee habilidades de razonamiento profundo más sólidas y su fiabilidad en tareas complejas se verá considerablemente mejorada.Cabe mencionar que algunos usuarios notaron que en el paper de DeepSeek-V3.2 se menciona el uso de la plataforma de competencia de grandes modelos (ChatbotArena) para la evaluación de preferencias humanas.Por lo tanto, es posible que podamos probar este modelo en la competencia de grandes modelos incluso antes de lo esperado.
0
0

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!
© 2025 Bitget