DeepSeek anuncia DeepGEMM de código abierto
Deepseek anunció la liberación de código abierto de DeepGEMM en el tercer día de la Semana del Código Abierto. DeepGEMM es una biblioteca diseñada específicamente para la multiplicación de matrices generales (GEMM) en FP8 de manera concisa y eficiente, con capacidades de escalado de grano fino, tal como se propone en DeepSeek-V3. Soporta tanto GEMMs regulares como agrupados de Mixture of Experts (MoE). La biblioteca está escrita en CUDA, no requiere compilación durante la instalación y compila todos los núcleos en tiempo de ejecución utilizando un módulo ligero de Just-In-Time (JIT). La biblioteca FP8GEMM proporciona soporte para entrenamiento e inferencia V3/R1.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
En tendencia
MásPrecios de las criptos
Más








