DeepSeek V4 revela: GPT/Claude enfrentan riesgos en programación durante el Año Nuevo Chino

量子位2026/01/10 01:37

Show original

By:量子位

🧨Con la proximidad del Festival de Primavera, este año DeepSeek está a punto de sorprender al mundo de nuevo🧨 📄Según información de medios extranjeros como The Information, dos personas familiarizadas directamente con el plan revelaron que DeepSeek lanzará V4 alrededor de mediados de febrero, coincidiendo con el Festival de Primavera, aunque la fecha podría ajustarse. 💪DeepSeek-V4 se centra en las capacidades de codificación, y los resultados preliminares de pruebas internas muestran que ya ha superado a modelos existentes como Claude de Anthropic y la serie GPT de OpenAI. Los dos informantes añadieron que los avances clave de V4 se reflejan en dos aspectos: 1️⃣Ha logrado avances clave en el procesamiento y análisis de prompts de código extra largo. 2️⃣Durante todas las fases del proceso de entrenamiento, la capacidad de comprensión de patrones de datos no mostró deterioro de rendimiento, y en comparación con la generación anterior hubo mejoras significativas. PD: El proceso de entrenamiento de modelos de IA exige que el modelo aprenda repetidamente de enormes conjuntos de datos. Sin embargo, en la práctica, a medida que aumenta el número de ciclos de entrenamiento, la capacidad del modelo para captar patrones de datos suele disminuir. Para los desarrolladores con grandes reservas de chips de IA, el método convencional para abordar este problema es aumentar los ciclos de entrenamiento para compensar la pérdida de rendimiento. 🧐Es probable que los usuarios noten en la práctica que las respuestas generadas por V4 tienen una lógica más clara y una estructura más ordenada. Esto indica que el modelo posee una capacidad de razonamiento profundo más fuerte, lo que mejorará considerablemente su fiabilidad al abordar tareas complejas. Vale la pena señalar que algunos usuarios han observado que en el artículo sobre DeepSeek-V3.2 se menciona que evaluaron las preferencias humanas utilizando la plataforma de competencia de grandes modelos (ChatbotArena). Por lo tanto, es posible que podamos probar este modelo antes en la arena de grandes modelos.

Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

DeepSeek V4 revela: GPT/Claude enfrentan riesgos en programación durante el Año Nuevo Chino

You may also like

Trending news

Crypto prices