LatePost ексклюзивно丨Zhipu виходить на біржу, внутрішній лист Tang Jie вимагає повного повернення до досліджень базових моделей
Те, що насправді визначає наступний етап розвитку, залишаються дві більш фундаментальні речі — архітектура моделей і парадигма навчання. Одночасно на стороні застосування може з’явитися чіткий напрямок: рік вибухового зростання, коли AI замінить різні професії/завдання.
Текст丨Шень Юань
Редактор丨Сун Вей
За ексклюзивною інформацією LatePost, 8 січня в день виходу Zhiyue на біржу, професор кафедри комп’ютерних наук університету Цінхуа, співзасновник і головний науковий співробітник Zhiyue Тан Цзе опублікував внутрішній лист, оголосивши, що незабаром буде представлено нове покоління моделі GLM-5.
Тан Цзе зазначив, що сьогодні — "захопливий день у житті Zhiyue". Він не дав прямої відповіді на суперечки щодо комерційної моделі компаній великих моделей чи цілі комерціалізації Zhiyue до 2026 року, але наголосив, що справжнє досягнення на шляху до AGI — це теорія, технологія чи продукт, якими дійсно користуються люди і які можуть допомогти більшій кількості людей.
DeepSeek спричинив шок серед китайських компаній великих моделей, багато хто вважає, що феноменальний успіх DeepSeek насамперед вплинув на екологічну нішу Zhiyue, адже обидві мають майже однакові академічні команди, а Zhiyue також зробив значний внесок в open-source екосистему великих моделей.
У внутрішньому листі зазначено, що Zhiyue у 2025 році вчасно виконав стратегію, визначену на початку року, а саме: у квітні випустити модель для "утримання позицій", у середині року — модель для "виходу на стіл" (стати one of the best), а наприкінці року — модель Top 1.
Така стратегія повного повернення до досліджень базових моделей є відповіддю Zhiyue на виклик DeepSeek. 23 грудня була випущена і відкрито розповсюджена базова модель Zhiyue GLM-4.7, згідно з Artificial Analysis (AA індекс інтелекту), GLM-4.7 посідає перше місце серед вітчизняних моделей і розділяє шосту позицію у світі з Claude 4.5 Sonnet.
Окрім анонсу GLM-5, у внутрішньому листі також представлені три технічні напрями, на яких Zhiyue зосередиться у 2026 році, зокрема, новий дизайн архітектури моделей, більш універсальна парадигма RL (підкріпленого навчання) і дослідження безперервного навчання та самостійної еволюції моделей. Всі вони спрямовані на посилення базових можливостей моделей.
У 2025 році Zhiyue також пережив значну організаційну реструктуризацію, скоротивши команди To C, продуктово-дослідницькі та відеогенерації, а такі розробки, як AutoGLM, поступово відкривалися.
З часу запуску ChatGPT, за більш ніж три роки стрімкого розвитку AI, "у галузі немає єдиного консенсусу, всі просто рухаються вперед". Про це Тан Цзе сказав під час однієї з внутрішніх зустрічей.
Нижче повний текст відкритого листа Тан Цзе, ексклюзивно опублікований LatePost за дозволом Zhiyue.
Створювати AGI з "кавовим" духом
Під час короткострокового візиту до Гонконзького університету науки і технологій я випадково зустрів професора Ян Цяна у кав'ярні на першому поверсі лабораторії. Я сказав, що за останні дні випив надто багато кави, відчуваю певну залежність і думаю, що варто обмежити себе.
Пан Ян відповів: "Навіщо обмежувати себе? Залежність не завжди погана річ. Якби ми займалися дослідженнями так само захоплено, як п’ємо каву, чи могли б ми не досягти успіху?"
Справді, "захопленість" — це і є суть життя, незалежно від досліджень чи чогось іншого, якщо ти зосереджений і наполегливий, результат обов'язково буде добрим.
"Зробити так, щоб машини мислили як люди" — це бачення і ідеал Zhiyue з самого початку, а також єдина мета, за яку команда Zhiyue невпинно бореться.
Наприкінці 2018 року, натхненні теорією двох систем людського мозку, ми розробили машинну "когнітивну" систему з швидким і повільним мисленням. У 2019 році ми офіційно заснували Zhiyue і почали дослідження AGI, прагнучи реалізувати велике бачення — "зробити так, щоб машини мислили як люди".
Головний виклик тут, мабуть, у тому, що й досі ніхто, включно з нами, не може дати точне визначення AGI або шляху до його реалізації. Можливо, саме це і є принадність дослідження AGI.
Ми перебуваємо в унікальний історичний момент, коли технології знову докорінно змінюють світ. Великі моделі — це не лише ключова основа загального штучного інтелекту, а й, ймовірно, стануть рушієм трансформації продуктивності.
Озираючись назад, одна з важливих причин, чому ми дійшли до сьогоднішнього дня, полягає в тому, що ми завжди наполягали на створенні AI-технологій, які дійсно корисні користувачам. Лише теорії, технології чи продукти, які реально використовують люди, можуть стати важливими досягненнями на шляху до AGI. Звісно, не всі інновації будуть успішними — багато наших ризикованих проєктів завершилися невдачею, але це навчило нас черпати сили з поразок, зробило Zhiyue сильнішим і поглибило наше розуміння AGI. Ще важливіше: це спрямувало нас на практичність і віддалило від короткострокових вигод — допомога користувачам, країні та світовому науково-технічному прогресу стала нашою довгостроковою метою.
У 2020 році ми випустили власну архітектуру великих моделей GLM і почали тренувати базову модель з 10 мільярдами параметрів. Модель була дуже успішною, її випробували багато компаній, включно з Meituan. Це був сміливий крок, адже тоді домінували невеликі моделі типу BERT. Але навіть тодішній успіх був далекий від нашої мрії про AGI. Частково через недостатній обсяг знань моделі, а також тому, що вона ще не вміла мислити й робити умовиводи як людина.
У 2021–2022 роках розвиток великих моделей йшов не найкраще. Більшість людей не сприймали ідею "змусити машини мислити як люди", вважаючи це надто фантастичним, і не бачили в цьому значної технологічної можливості, або ж боялися провалу. Ми все ж вирішили ризикнути й натренувати модель із 130 мільярдами параметрів на ще більшій кількості даних.
Це було складне рішення, адже не можна було порушити загальний ритм розвитку компанії. Для цього ми створили дві спеціальні невеликі інноваційні команди: одна займалася тренуванням моделей (яка згодом стала "трьома мушкетерами" GLM), інша — платформою MaaS. Тоді ці дві команди, можливо, навіть не знали одна про одну. В середині 2022 року ми завершили тренування GLM-130B, багато її тонких дизайнерських рішень привернули увагу світу; одночасно запустили платформу MaaS (bigmodel.cn) і залучили перших справжніх користувачів API. Згодом ми офіційно створили AI-інститут у компанії, який зосередився на дослідженні наступного покоління великих моделей, а також департамент MaaS для надання API-сервісів зовні. Іноді потрібно знайти людей із достатньо сміливими мріями (іноді навіть спеціально витрачати більше сил на пошук таких людей) — велика амбітна мета може наполовину визначити успіх.
У 2023 році я спілкувався з одним провідним підприємцем (насправді він набагато молодший за мене) про те, як AI може змінити майбутнє. Ми були одностайні, що AI переверне пошук, браузери, принесе кожному нового AI-асистента; і навіть після цього нам більше не потрібні будуть магазини застосунків, а навпаки, потрібно створити "магазин API" для AI, і, можливо, логіка цього магазину API стане базою для руйнування існуючих операційних систем; згодом, ще більшою революцією може стати сам комп'ютер, адже тоді нам, можливо, не потрібен буде комп’ютер для людей, а комп’ютер, створений для AI.
Значення цієї трансформації буде безмежним, адже вона докорінно змінить базову логіку комп’ютерів, кинувши виклик основі, яка трималася 80 років — архітектурі фон Неймана. Коли ми це обговорювали, ми обидва відчували, що наш внесок в AI ще недостатньо all-in.
Реальність жорстка: all-in вимагає не лише твердої віри, а й величезних фінансових і командних ресурсів, а також точного передбачення. 2023–2024 роки — це вибуховий рік великих моделей у світі, великі компанії масово "all-in" у великі моделі, в країні розгорнулася хвиля стартапів, сотні моделей з’являються щодня, різноманітні AI-асистенти з’являються один за одним.
Тоді ми, можливо, теж допустили деякі помилки — як технічні, так і комерційні. Оглядаючись назад, можливо, причина в тому, що ми іноді губилися на шляху до AGI, піддавалися спокусі короткострокових вигід і хайпу. AGI — це технологічна революція, технологія має бути інклюзивною, прозорою, такою, щоб кожен міг нею користуватися і отримувати вигоду.
Поява DeepSeek стала для нас сигналом. Коли Вень Фен заснував стартап у 2023 році, він говорив зі мною, і тоді я не усвідомлював, наскільки він відданий AGI. Дякую йому за нові ідеї. Вибір — це наполегливість у дослідженні AGI, постійне пошук верхньої межі AGI і точне передбачення майбутнього — саме це має постійно вдосконалюватися й розвиватися у Zhiyue. Ці два роки багато чого нас навчили, і ще важливіше — "підкріпили навчання" нашого розуміння AGI, управління компанією та конкуренції.
За минулий рік ми, по суті, провели системне "підкріплення". Ми проголосили гасло "стійкість" і "досягнення", закликаючи всіх зберігати стійкість, не бути зарозумілими і не применшувати себе, досягати своїх цілей у Zhiyue і власних.
На початку року все було дуже складно, ефективність моделей не виправдовувала очікувань, по всій країні йшла цінова війна, і щоб прорватися, потрібно було знайти точну точку прориву.
Ми утримали свої позиції і нарешті знайшли точку прориву у Coding.
Якщо випуск GLM-4.1 у квітні був символічною розвідкою, то випуск GLM-4.5 наприкінці липня став майже вирішальним боєм — усі технічні, платформні та бізнес-команди працювали напружено, вдень і вночі, і ми нарешті здобули довгоочікувану перемогу. Далі GLM-4.6 і GLM-4.7 дозволили нам зрівнятися з провідними світовими моделями. Наш GLM-4.7 отримав SOTA серед open-source і китайських моделей у багатьох тестуваннях, таких як AA, Arena тощо, а реальні відгуки користувачів про Coding і Agent були дуже хорошими: 150 000 розробників із 184 країн користуються GLM Coding Plan, після релізу GLM-4.7 ARR платформи MaaS перевищив 500 мільйонів (з них понад 200 мільйонів — закордонні доходи), а зростання з 20 мільйонів до 500 мільйонів (у 25 разів) зайняло лише 10 місяців.
У цілому з боку моделей ми виконали загальну стратегію: у квітні випустити "модель для утримання позицій", у середині року — "модель для виходу на стіл" (one of the best), а наприкінці року — Top 1. Це заклало важливий фундамент для нашого подальшого прориву у технологіях AGI.
Наш "суверенний AI" також досяг нового прогресу: національна платформа MaaS у Малайзії побудована на базі open-source моделі Z.ai, а GLM став національною моделлю для Малайзії. Виведення суверенного AI за кордон стало для мене результатом натхнення після зустрічі з Генеральним секретарем, який закликав, що "китайський AI повинен вийти за кордон". Відверто кажучи, я не знав, як це робити, але наша міжнародна команда була сміливою і рішучою, здійснивши прорив з нуля для китайських великих моделей за кордоном. У бізнесі ми не боїмося конкуренції й вдруге виконали річний план із зростанням доходів удвічі.
Попри всі труднощі й можливості, сьогодні ми стали першою компанією великих моделей у світі, що вийшла на біржу — майже неймовірний результат, який свідчить про визнання нашої технологічної й комерційної цінності ринком. "Make impossible possible" — пам’ятаєте, як ми колись це казали?
За цей рік, можливо, найбільше змінилися не Zhiyue, а група молодих людей на передовій, які справді зробили багато з того, що здавалося неможливим.
У 2026 році ціль компанії — стати провідною міжнародною компанією великих моделей. Минулого року багато хто обговорював великі моделі, багато говорили про застосування й екосистему.
Те, що насправді визначає наступний етап розвитку, залишаються дві більш фундаментальні речі — архітектура моделей і парадигма навчання. Одночасно на стороні застосування може з’явитися чіткий напрямок: рік вибухового зростання, коли AI замінить різні професії/завдання.
Виходячи з цього, у 2026 році ми зосередимося на:
GLM-5. Незабаром GLM-5 буде представлений широкій публіці, і завдяки подальшому масштабуванню та багатьом новим технологічним удосконаленням, ми віримо, що GLM-5 принесе багато нових вражень і допоможе виконувати ще більше реальних завдань за допомогою AI.
Новий дизайн архітектури моделей. Архітектура Transformer, яку широко використовують майже 10 років, вже має певні недоліки, зокрема обчислювальні витрати при наддовгому контексті, механізми пам'яті й оновлення. Потрібно досліджувати нову архітектуру моделей, відкривати нові парадигми масштабування, підвищувати ефективність обчислень шляхом кооперації між чіпами та алгоритмами.
RL із сильнішою здатністю до узагальнення. Сучасна парадигма RLVR досягла успіху у математиці та програмуванні, але її залежність від ручного створення перевірених середовищ стає все більш очевидною. Цього року потрібно дослідити більш універсальні парадигми RL, щоб AI міг не лише виконувати конкретні завдання за людськими інструкціями, а й розуміти та виконувати довготривалі завдання, що тривають години або навіть дні.
Найбільш складне завдання — розпочати шлях до безперервного навчання й самостійної еволюції. Зараз усі основні AI-моделі після розгортання мають майже статичний інтелект: вони отримують знання під час одноразового, дорогого тренування, а потім поступово застарівають у застосуванні. Це відрізняється від людського мозку, який постійно навчається й еволюціонує у взаємодії зі світом. Нам потрібно заздалегідь планувати наступне покоління парадигм навчання — онлайн-навчання або безперервне навчання.
Ми не є традиційною компанією й не маємо наміру бути такою. Ми хочемо бути AI-орієнтованою компанією, де все можливо: створювати нове покоління моделей, що постійно підвищують межі інтелекту, розробляти продукти з AI у центрі, які служать користувачам. Ми прагнемо, щоб AI став найкращим помічником кожного, допомагав виконувати завдання, а також брав участь в управлінні компанією для підвищення ефективності та справедливості.
З часом компанії часто звикають робити одне й те саме, поступово вдосконалюючись, що обмежує нашу інноваційність. Але в епоху AI все відбувається революційно: нам потрібно відчувати себе трохи "не у своїй тарілці", щоб зберегти інноваційність і висувати революційні ідеї для просування наступної великої галузі зростання.
Тому ми створили в Zhiyue новий підрозділ X-Lab, який відкрито залучатиме більше молоді для передових досліджень — від нових архітектур і когнітивних парадигм до інкубації нових проєктів, як у софті, так і у залізі. Ми також розширимо зовнішні інвестиції, не лише стратегічно співпрацюючи з наявними компаніями, а й відкриваючи нові напрямки, щоб об'єднати всю галузь і розвивати всю екосистему. Місія кожного в X-Lab — робити повністю революційні інновації, повертаючись зрештою до головної лінії AGI.
Сьогодні — захопливий день у житті Zhiyue, важлива віха в історії компанії і початок нової ери. Мені дуже подобається бренд Z.ai: Z — остання літера алфавіту, символізує кінцеву мету. Ми сподіваємось дійти до кінця розвідки AGI, до найвищої межі інтелекту — це наша мета. Ми дуже натхненні:
- Мати амбітну, змінюючу світ справу
- Дивитися у майбутнє й орієнтуватися на довгострокову вигоду
- Бути більш зосередженими, досліджувати суть AGI
- Використовувати AI для підтримки зростання великих підприємців і компаній
- Схоплювати можливості розвитку бізнесу завдяки точному передбаченню
- Зрештою, ми сподіваємося принести людству якісно новий AI і реально сприяти підвищенню добробуту людства.
Це неймовірно радісний момент, ця радість — не миттєва дофамінова ейфорія, а накопичений на шляху до AGI ендорфін, що робить нас більш сфокусованими, приземленими й незмінно рухає вперед!
Тан Цзе
2026.1.8
Зображення на початку: "Дюна 2"
- FIN -
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
Де амбіції Meta щодо метавсесвіту не виправдалися
Націлювання на $900 млрд переказів може стати рушієм для найкращої криптовалюти для купівлі у 2026 році

ETH зупинився, Pepe впав, етап 2 спалювання монет Zero Knowledge Proof може стати початком вибуху у 7000 разів!

