DeepSeek V4 revela: GPT/Claude enfrentan riesgos en programación durante el Año Nuevo Chino
Show original
By:量子位
🧨Con la proximidad del Festival de Primavera, este año DeepSeek está a punto de sorprender al mundo de nuevo🧨 📄Según información de medios extranjeros como The Information, dos personas familiarizadas directamente con el plan revelaron que DeepSeek lanzará V4 alrededor de mediados de febrero, coincidiendo con el Festival de Primavera, aunque la fecha podría ajustarse. 💪DeepSeek-V4 se centra en las capacidades de codificación, y los resultados preliminares de pruebas internas muestran que ya ha superado a modelos existentes como Claude de Anthropic y la serie GPT de OpenAI. Los dos informantes añadieron que los avances clave de V4 se reflejan en dos aspectos: 1️⃣Ha logrado avances clave en el procesamiento y análisis de prompts de código extra largo. 2️⃣Durante todas las fases del proceso de entrenamiento, la capacidad de comprensión de patrones de datos no mostró deterioro de rendimiento, y en comparación con la generación anterior hubo mejoras significativas. PD: El proceso de entrenamiento de modelos de IA exige que el modelo aprenda repetidamente de enormes conjuntos de datos. Sin embargo, en la práctica, a medida que aumenta el número de ciclos de entrenamiento, la capacidad del modelo para captar patrones de datos suele disminuir. Para los desarrolladores con grandes reservas de chips de IA, el método convencional para abordar este problema es aumentar los ciclos de entrenamiento para compensar la pérdida de rendimiento. 🧐Es probable que los usuarios noten en la práctica que las respuestas generadas por V4 tienen una lógica más clara y una estructura más ordenada. Esto indica que el modelo posee una capacidad de razonamiento profundo más fuerte, lo que mejorará considerablemente su fiabilidad al abordar tareas complejas. Vale la pena señalar que algunos usuarios han observado que en el artículo sobre DeepSeek-V3.2 se menciona que evaluaron las preferencias humanas utilizando la plataforma de competencia de grandes modelos (ChatbotArena). Por lo tanto, es posible que podamos probar este modelo antes en la arena de grandes modelos.
0
0
Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.
PoolX: Haz staking y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!
You may also like
Syrah Resources de Australia asegura una extensión para el acuerdo de suministro de grafito con Tesla
101 finance•2026/01/19 00:08
El utopismo de la IA oculta el miedo de los multimillonarios tecnológicos: Douglas Rushkoff
Decrypt•2026/01/18 23:27
Tesla lanza la primera refinería de litio a gran escala del país
101 finance•2026/01/18 23:26
Trending news
MoreCrypto prices
MoreBitcoin
BTC
$92,714.52
-2.54%
Ethereum
ETH
$3,246.68
-1.85%
Tether USDt
USDT
$0.9996
-0.01%
BNB
BNB
$920.89
-2.70%
XRP
XRP
$1.94
-5.90%
Solana
SOL
$134.7
-6.27%
USDC
USDC
$0.9998
+0.00%
TRON
TRX
$0.3163
-0.83%
Dogecoin
DOGE
$0.1272
-7.70%
Cardano
ADA
$0.3582
-9.73%
Cómo vender PI
PI llega a Bitget: ¡Compra o vende PI rápidamente en Bitget!
Operar ahora
¿Aún no eres un Bitgetter?¡Un paquete de bienvenida de 6.200 USDT para los nuevos Bitgetters!
Regístrate ahora
