Deepseek v3.2... nowy otwarty SOTA (1 grudnia)

Bitget

Wiadomości

180k2026/01/06 19:21

Pokaż oryginał

Przez:180k

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 0

Uproszczony przepływ informacji

Przed chwilą analizowałem wydanie deepseek w metrze...

Poniżej szybkie podsumowanie,

1/ Wydanie Deepseek tym razem przyniosło naprawdę imponujące rezultaty.

Bez wątpienia open-source SOTA;
Wszystkie zdolności praktycznie odpowiadają najnowszym, zamkniętym modelom;

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 1

2/ Od strony technologicznej nie jest to bardzo nowe,

Nadal korzysta się z DSA + post train, udział powyżej 10% to już nie jest wielka nowość;
Nowością jest to, że używając tych samych rzeczy z poprzedniej wersji v3.2 uzyskano tak dobre efekty, że można bezpośrednio konkurować z gemini3.0, najnowszym SOTA na rynku;
Obecnie publikacje naukowe coraz trudniej napędzają narrację rynkową; tym razem możliwości są bardziej namacalne.

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 2

3/ Największa obawa — załamanie mocy obliczeniowej? Nie istnieje.

Zgodnie z wypowiedzią deepseek,nadal mamy dystans do najbardziej zaawansowanych modeli.

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 3

Z innej perspektywy, "fosy wiedzy" na poziomie modelu są iluzoryczne,moc obliczeniowa pozostaje czynnikiem różnicującym.

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 4

Pogląd badacza Deepseek Zhibin Gou; gemini3 udowodnił pretrain...deepseek 3.2 udowodnił RL;

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 5

Kontynuować skalowanie na każdym poziomie; nie pozwól, aby szum pesymistów zakłócał postępy.

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 6

Cięższe RL, dłuższe CoT, większe zużycie mocy obliczeniowej podczas wnioskowania;nie doprowadzi to do narracji o deflacji mocy obliczeniowej.

4/ Z perspektywy zastosowań... na pewno jest to korzystne. Cytując użytkownika z Gwiezdnej Społeczności,

"Zapotrzebowanie na moc obliczeniową jest nieskończone, obecne koszty tokenów mają niewielką wartość użytkową, tylko dzięki innowacjom sprzętowym i modelowym można geometrycznie obniżyć koszty i osiągnąć masowe zastosowanie"
Dla firm, które chcą budować "fosę aplikacyjną" na bazie możliwości modelu (np. pewien OAI),to poważne osłabienie narracji.

5/ Deepseek twierdzi, że efektywność wykorzystania tokenów jest "inferior"...W wersji Speciale zużyto ich więcej... (czerwona ramka tam)...

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 7

6/ Jako ciekawostka, Zhibin Gou powiedział, że spędzili rok doprowadzając v3 do granic możliwości... niektórzy użytkownicy w czacie Gwiezdnej Społeczności uważają, że wycisnęli już wszystko z v3,czy następna wersja to wreszcie v4?

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 8

7/ Dziś wydaje się, że przypada 3. rocznica uruchomienia ChatGPT...

Deepseek v3.2... nowy otwarty SOTA (1 grudnia) image 9

Dziś wieczorem rynek prawdopodobnie będzie bardzo zmienny... japońskie czynniki makro + BTC wprowadzają zamieszanie;

Następnym małym katalizatorem może być re:invent Amazona; rano w grupie były też krótkie przewidywania.

Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.

PoolX: Stakuj, aby zarabiać

Nawet ponad 10% APR. Zarabiaj więcej, stakując więcej.

Stakuj teraz!