DeepSeek V4 revela: crisis de programación de GPT/Claude durante el Año Nuevo Chino
Mostrar el original
Por:量子位
🧨Se acerca el Año Nuevo Chino y este año DeepSeek está a punto de sorprender al mundo nuevamente🧨📄Según información de medios internacionales como The Information, dos personas con conocimiento directo del plan revelaron que DeepSeek lanzará la V4 a mediados de febrero, alrededor del Año Nuevo Chino, aunque la fecha podría ajustarse.💪DeepSeek-V4 se destaca por su capacidad de codificación; los resultados preliminares de las pruebas internas muestran que ya ha superado a modelos existentes como Claude de Anthropic y la serie GPT de OpenAI.Las dos fuentes también agregaron que las innovaciones clave de la V4 se reflejan en dos aspectos:1️⃣ Logró avances fundamentales en el procesamiento y análisis de prompts de código extremadamente largos.2️⃣ Durante todas las etapas del proceso de entrenamiento, la capacidad de comprensión de patrones de datos no mostró deterioro en el rendimiento, y presenta una mejora significativa respecto a las versiones anteriores.PD: El proceso de entrenamiento de modelos de IA exige que el modelo aprenda repetidamente de conjuntos de datos masivos. Sin embargo, en la práctica, a medida que aumentan las rondas de entrenamiento, la capacidad del modelo para captar patrones de datos suele disminuir. Para los desarrolladores con grandes reservas de chips de IA, la forma habitual de abordar este problema es aumentar las rondas de entrenamiento para compensar la pérdida de rendimiento.🧐Es muy probable que los usuarios noten en el uso real que las respuestas generadas por la V4 tienen una lógica más clara y una estructura mejor organizada. Esto indica que el modelo posee habilidades de razonamiento profundo más sólidas y su fiabilidad en tareas complejas se verá considerablemente mejorada.Cabe mencionar que algunos usuarios notaron que en el paper de DeepSeek-V3.2 se menciona el uso de la plataforma de competencia de grandes modelos (ChatbotArena) para la evaluación de preferencias humanas.Por lo tanto, es posible que podamos probar este modelo en la competencia de grandes modelos incluso antes de lo esperado.
0
0
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
PoolX: Haz staking y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!
También te puede gustar
El salto del 46% de Lumen en 2025 se extiende a 2026 impulsado por apuestas en inteligencia artificial
Cointelegraph•2026/01/18 16:43
Donde las ambiciones de Meta para el metaverso se quedaron cortas
101 finance•2026/01/18 15:05
En tendencia
MásPrecios de las criptos
MásBitcoin
BTC
$95,146.54
-0.14%
Ethereum
ETH
$3,336.22
+0.58%
Tether USDt
USDT
$0.9997
+0.00%
BNB
BNB
$950.4
-0.02%
XRP
XRP
$2.06
-0.78%
Solana
SOL
$142.06
-1.22%
USDC
USDC
$0.9999
+0.01%
TRON
TRX
$0.3188
+1.29%
Dogecoin
DOGE
$0.1368
-1.29%
Cardano
ADA
$0.3924
-1.91%
Cómo vender PI
PI llega a Bitget. ¡Compra o vende PI rápidamente en Bitget!
Haz trading ahora
¿Aún no eres Bitgetter?¡Un paquete de bienvenida de 6.200 USDT para los nuevos usuarios!
Regístrate ahora