DeepSeek V4 revela: crisis de programación de GPT/Claude durante el Año Nuevo Chino

量子位2026/01/10 01:37

Mostrar el original

Por:量子位

🧨Se acerca el Año Nuevo Chino y este año DeepSeek está a punto de sorprender al mundo nuevamente🧨📄Según información de medios internacionales como The Information, dos personas con conocimiento directo del plan revelaron que DeepSeek lanzará la V4 a mediados de febrero, alrededor del Año Nuevo Chino, aunque la fecha podría ajustarse.💪DeepSeek-V4 se destaca por su capacidad de codificación; los resultados preliminares de las pruebas internas muestran que ya ha superado a modelos existentes como Claude de Anthropic y la serie GPT de OpenAI.Las dos fuentes también agregaron que las innovaciones clave de la V4 se reflejan en dos aspectos:1️⃣ Logró avances fundamentales en el procesamiento y análisis de prompts de código extremadamente largos.2️⃣ Durante todas las etapas del proceso de entrenamiento, la capacidad de comprensión de patrones de datos no mostró deterioro en el rendimiento, y presenta una mejora significativa respecto a las versiones anteriores.PD: El proceso de entrenamiento de modelos de IA exige que el modelo aprenda repetidamente de conjuntos de datos masivos. Sin embargo, en la práctica, a medida que aumentan las rondas de entrenamiento, la capacidad del modelo para captar patrones de datos suele disminuir. Para los desarrolladores con grandes reservas de chips de IA, la forma habitual de abordar este problema es aumentar las rondas de entrenamiento para compensar la pérdida de rendimiento.🧐Es muy probable que los usuarios noten en el uso real que las respuestas generadas por la V4 tienen una lógica más clara y una estructura mejor organizada. Esto indica que el modelo posee habilidades de razonamiento profundo más sólidas y su fiabilidad en tareas complejas se verá considerablemente mejorada.Cabe mencionar que algunos usuarios notaron que en el paper de DeepSeek-V3.2 se menciona el uso de la plataforma de competencia de grandes modelos (ChatbotArena) para la evaluación de preferencias humanas.Por lo tanto, es posible que podamos probar este modelo en la competencia de grandes modelos incluso antes de lo esperado.

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

También te puede gustar

El salto del 46% de Lumen en 2025 se extiende a 2026 impulsado por apuestas en inteligencia artificial

Cointelegraph•2026/01/18 16:43

"Sin motivación para mantener": Las acciones de software se desploman en medio de preocupaciones por la última tecnología de IA

101 finance•2026/01/18 16:29

"Una gama cada vez más amplia de oportunidades": Wall Street anticipa que el crecimiento del mercado de valores se extienda más allá del sector tecnológico

101 finance•2026/01/18 16:11

Donde las ambiciones de Meta para el metaverso se quedaron cortas

101 finance•2026/01/18 15:05