Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre)

Bitget

Novedades

180k2026/01/06 19:21

Mostrar el original

Por:180k

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 0

Un flujo de información simplificado

Recién estuve investigando el lanzamiento de deepseek en el subte...

A continuación, un resumen rápido,

1/ El lanzamiento de Deepseek esta vez produjo resultados realmente impresionantes.

Sin dudas, es el sota open source;
En casi todas sus capacidades está al nivel de los modelos cerrados más avanzados;

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 1

2/ En términos tecnológicos, no es algo totalmente nuevo,

Sigue utilizando DSA + post train, y que este último supere el 10% tampoco es noticia;
La novedad es que, usando lo del experimento v3.2, los resultados son tan buenos, compitiendo directamente con SOTA como gemini3.0, recién lanzado;
Ahora la literatura académica ya no impulsa tanto la narrativa del mercado; el rendimiento de las capacidades es mucho más intuitivo.

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 2

3/ ¿El mayor miedo era el colapso de la capacidad de cómputo? No existe tal cosa.

Según Deepseek, todavía hay una brecha con los modelos más avanzados.

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 3

Visto desde otra perspectiva, la "muralla de conocimiento" a nivel de modelo es bastante difusa, la capacidad de cómputo sigue siendo un factor diferenciador.

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 4

Opinión del investigador de Deepseek, Zhibin Gou; gemini3 demuestra pretrain... deepseek 3.2 demuestra RL;

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 5

Seguir escalando en todos los niveles; que el ruido de los que chocan contra la pared no te distraiga.

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 6

Más RL, cadenas de pensamiento más largas, mayor consumo de cómputo en inferencia; no se puede concluir una narrativa de deflación de cómputo.

4/ Desde el punto de vista de las aplicaciones... claramente es algo positivo. Citando a un usuario de la comunidad,

"La demanda de cómputo es infinita, y el costo de tokens actual tiene poco valor práctico; solo con innovaciones en hardware y modelos para reducir el costo geométricamente se podrá lograr una aplicación masiva"
Para las empresas que quieren construir una "muralla de defensa" en sus apps basadas en la capacidad de modelo (como cierta OAI), de hecho, esto debilita bastante esa narrativa.

5/ Deepseek admite que la eficiencia del uso de tokens es “inferior”... aquí en la versión Speciale, la cantidad de tokens usada es mayor...(el recuadro rojo)...

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 7

6/ Bonus: Zhibin Gou dijo que estuvieron un año llevando v3 al límite... Algunos amigos en los grupos de la comunidad piensan que, después de exprimir v3,¿finalmente vendrá v4 en la próxima versión??

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 8

7/ Hoy parece ser el tercer aniversario del lanzamiento de ChatGPT...

Deepseek v3.2... nuevo SOTA de código abierto (1 de diciembre) image 9

Esta noche el mercado debería estar bastante volátil... Algunos factores macroeconómicos en Japón + BTC generando movimientos;

El próximo pequeño evento catalizador podría ser el re:invent de Amazon; también se discutió un poco esta mañana en el grupo.

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!