Deepseek v3.2... nowy otwarty SOTA (1 grudnia)
Uproszczony przepływ informacji Przed chwilą analizowałem wydanie deepseek w metrze...
Poniżej szybkie podsumowanie,
1/ Wydanie Deepseek tym razem przyniosło naprawdę imponujące rezultaty.
- Bez wątpienia open-source SOTA;
- Wszystkie zdolności praktycznie odpowiadają najnowszym, zamkniętym modelom;
2/ Od strony technologicznej nie jest to bardzo nowe,
- Nadal korzysta się z DSA + post train, udział powyżej 10% to już nie jest wielka nowość;
- Nowością jest to, że używając tych samych rzeczy z poprzedniej wersji v3.2 uzyskano tak dobre efekty, że można bezpośrednio konkurować z gemini3.0, najnowszym SOTA na rynku;
- Obecnie publikacje naukowe coraz trudniej napędzają narrację rynkową; tym razem możliwości są bardziej namacalne.
3/ Największa obawa — załamanie mocy obliczeniowej? Nie istnieje.
Zgodnie z wypowiedzią deepseek,nadal mamy dystans do najbardziej zaawansowanych modeli.
Z innej perspektywy, "fosy wiedzy" na poziomie modelu są iluzoryczne,moc obliczeniowa pozostaje czynnikiem różnicującym.
Pogląd badacza Deepseek Zhibin Gou; gemini3 udowodnił pretrain...deepseek 3.2 udowodnił RL;
Kontynuować skalowanie na każdym poziomie; nie pozwól, aby szum pesymistów zakłócał postępy.
Cięższe RL, dłuższe CoT, większe zużycie mocy obliczeniowej podczas wnioskowania;nie doprowadzi to do narracji o deflacji mocy obliczeniowej.
4/ Z perspektywy zastosowań... na pewno jest to korzystne. Cytując użytkownika z Gwiezdnej Społeczności,
-
"Zapotrzebowanie na moc obliczeniową jest nieskończone, obecne koszty tokenów mają niewielką wartość użytkową, tylko dzięki innowacjom sprzętowym i modelowym można geometrycznie obniżyć koszty i osiągnąć masowe zastosowanie"
-
Dla firm, które chcą budować "fosę aplikacyjną" na bazie możliwości modelu (np. pewien OAI),to poważne osłabienie narracji.
5/ Deepseek twierdzi, że efektywność wykorzystania tokenów jest "inferior"...W wersji Speciale zużyto ich więcej... (czerwona ramka tam)...
6/ Jako ciekawostka, Zhibin Gou powiedział, że spędzili rok doprowadzając v3 do granic możliwości... niektórzy użytkownicy w czacie Gwiezdnej Społeczności uważają, że wycisnęli już wszystko z v3,czy następna wersja to wreszcie v4?
7/ Dziś wydaje się, że przypada 3. rocznica uruchomienia ChatGPT...
Dziś wieczorem rynek prawdopodobnie będzie bardzo zmienny... japońskie czynniki makro + BTC wprowadzają zamieszanie;
Następnym małym katalizatorem może być re:invent Amazona; rano w grupie były też krótkie przewidywania.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Rynki kryptowalut przygotowują się na burzliwe czasy w związku z eskalacją napięć między USA a UE
Akcje KLA Corp. otrzymują najwyższy dotąd cel cenowy — czy to już czas, by zainwestować w KLAC?
