Модель DeepSeek-V3.2-Exp официально выпущена и открыта в открытый доступ
ChainCatcher сообщает, что модель DeepSeek-V3.2-Exp была официально выпущена и открыта для общего доступа сегодня. Модель внедряет архитектуру разреженного Attention, которая позволяет эффективно снизить потребление вычислительных ресурсов и повысить эффективность вывода модели. В настоящее время данная модель уже размещена на облачной платформе Huawei для крупных моделей как сервис (MaaS). Для DeepSeek-V3.2-Exp Huawei Cloud по-прежнему использует крупномасштабную параллельную схему EP, реализуя стратегию параллелизма контекста, подходящую для длинных последовательностей на основе структуры разреженного Attention, при этом обеспечивая баланс между задержкой модели и производительностью пропускной способности.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
