Late Exclusive de LatePost | Zhipu sale a la bolsa, Tang Jie exige en una carta interna un regreso total a la investigación de modelos básicos
Lo que realmente determinará la configuración de la próxima etapa serán dos cuestiones aún más fundamentales: la arquitectura del modelo y el paradigma de aprendizaje. Al mismo tiempo, en el lado de las aplicaciones podría surgir una dirección clara: el año de explosión de la sustitución de diferentes oficios/tareas por parte de la IA.
Por|Shen Yuan
Edición|Song Wei
Según información exclusiva de LatePost, el 8 de enero, el día de la salida a bolsa de Zhipu, Tang Jie, profesor del Departamento de Computación de la Universidad de Tsinghua, fundador e impulsor de Zhipu y su científico jefe, emitió una carta interna anunciando que pronto lanzarán la nueva generación del modelo GLM-5.
Tang Jie dijo que hoy es "un día emocionante en la vida de Zhipu". No respondió directamente a la polémica sobre el modelo de negocio de las empresas de modelos de lenguaje ni presentó el objetivo de comercialización de Zhipu para 2026, pero enfatizó que el verdadero logro importante de Zhipu en la búsqueda del AGI es lograr que "alguien lo use realmente", y que las teorías, tecnologías o productos que ayuden a más personas sean su mayor éxito.
DeepSeek generó un impacto para las empresas chinas de modelos de lenguaje; muchos creen que el éxito fenomenal de DeepSeek afectó primero el nicho de Zhipu, ya que ambas cuentan con equipos académicos y de investigación muy similares, y Zhipu también ha realizado grandes contribuciones en el ecosistema open source de modelos de lenguaje.
La carta interna señala que en 2025 Zhipu completó según lo previsto la estrategia establecida a principios de año: lanzar en abril un modelo para "mantener la posición", a mediados de año uno que "ingrese a la mesa principal" (convirtiéndose en uno de los mejores) y a fin de año un modelo Top 1.
Esta estrategia de volver completamente a la investigación de modelos fundamentales es la respuesta de Zhipu al impacto de DeepSeek. El 23 de diciembre, el modelo base GLM-4.7 de Zhipu se lanzó y se abrió al público; según el Artificial Analysis (Índice de Inteligencia Artificial, AA), el GLM-4.7 se ubicó primero entre los modelos nacionales y empató en el sexto lugar mundial con Claude 4.5 Sonnet.
Además del lanzamiento de GLM-5, la carta interna también presentó los tres enfoques tecnológicos en los que Zhipu se centrará en 2026: el diseño de una nueva arquitectura de modelo, un paradigma de refuerzo de aprendizaje (RL) más general y la exploración del aprendizaje continuo y la evolución autónoma de los modelos. Todos estos puntos giran en torno a mejorar las capacidades de los modelos fundamentales.
En 2025, Zhipu también experimentó una reestructuración organizacional de gran alcance, reduciendo el tamaño de los equipos To C, de producción e investigación y de generación de video, y abriendo progresivamente los resultados, incluido AutoGLM.
Desde el lanzamiento de ChatGPT, en poco más de tres años de rápido desarrollo de la IA, "la industria no ha alcanzado ningún consenso, simplemente todos siguen avanzando". Dijo Tang Jie en una charla interna.
A continuación, el texto completo de la carta pública de Tang Jie, publicada en exclusiva por LatePost con autorización de Zhipu.
Hacer AGI con el espíritu del “café”
Durante una breve estancia en la Universidad de Ciencia y Tecnología de Hong Kong, me crucé por casualidad con el profesor Yang Qiang en la cafetería del primer piso del laboratorio. Le comenté que había tomado demasiado café estos días, que sentía una especie de adicción y que necesitaba dejarlo por un tiempo.
El profesor Yang dijo: “¿Por qué dejarlo? ¡La adicción no necesariamente es algo malo! Si pudiéramos investigar con la misma adicción con la que tomamos café, ¿acaso nos preocuparíamos de no hacer bien la investigación?”.
Es verdad, “la adicción” es lo que hace interesante la vida; ya sea en la investigación o en cualquier otra cosa, si nos enfocamos y nos esforzamos, seguro que lo haremos bien.
“Hacer que las máquinas piensen como personas” es la visión y el ideal de Zhipu desde el principio, y la única meta por la que todos en Zhipu luchan de forma constante.
A fines de 2018, inspirados por la teoría de los dos sistemas de la cognición humana, diseñamos un sistema de “cognición” de máquina con pensamiento rápido y pensamiento lento. En 2019, fundamos oficialmente Zhipu, comenzando la exploración del AGI para realizar la ambiciosa visión de “hacer que las máquinas piensen como personas”.
El mayor desafío aquí quizás sea que, hasta hoy, nadie, ni siquiera nosotros, puede dar una definición precisa de AGI ni una ruta técnica clara para lograrlo. Tal vez esa es justamente la fascinación de explorar el AGI.
Vivimos un momento histórico sin precedentes, en el que una tecnología vuelve a transformar el mundo de forma disruptiva. Los grandes modelos no solo son la base clave de la inteligencia artificial generalista, sino también el motor central que impulsará la transformación de la productividad.
Al repasar nuestro recorrido, una de las razones más importantes por las que llegamos hasta aquí es que siempre insistimos en crear tecnologías de IA realmente útiles para los usuarios. Solo las teorías, tecnologías o productos que realmente son utilizados por personas pueden convertirse en logros importantes en el camino hacia el AGI. Por supuesto, no todas las innovaciones tienen éxito; muchos de nuestros proyectos arriesgados han fracasado, pero también nos enseñaron a obtener fuerza de los fracasos, lo que hizo a Zhipu más fuerte y profundizó nuestra comprensión del AGI. Más importante aún, esto nos hizo enfocarnos en la utilidad sin mirar solo el beneficio a corto plazo: ayudar a los usuarios, al país y al avance tecnológico global se convirtió en el objetivo a largo plazo de Zhipu.
En 2020, lanzamos nuestra propia arquitectura de algoritmo de modelo grande, GLM, y comenzamos a entrenar un modelo base de 10 mil millones de parámetros. El modelo tuvo éxito y fue probado por muchas empresas, incluido Meituan. Fue un intento audaz, ya que en ese momento prevalecían los pequeños modelos tipo BERT. Pero el éxito de entonces estaba aún muy lejos de nuestro sueño de AGI. En parte porque la cantidad de conocimiento del modelo no era suficiente, y también porque el modelo aún no podía razonar como un ser humano.
Entre 2021 y 2022, el desarrollo de los grandes modelos no fue sencillo; la mayoría no aceptaba la idea de “hacer que las máquinas piensen como personas”, un plan tan loco como ir a la luna, ni creía que fuera una gran oportunidad de transformación tecnológica, o simplemente temían fracasar. Aun así, decidimos arriesgarnos y entrenar un modelo grande de 130 mil millones de parámetros con más datos.
Tomar esa decisión fue difícil, ya que no debía afectar el ritmo general de la empresa. Para ello, formamos dos pequeños equipos de innovación: uno para entrenar modelos, que luego se convirtió en los “tres mosqueteros” de GLM; el otro, independiente, para construir la plataforma MaaS. Puede que no supieran de la existencia del otro. A mediados de 2022, GLM-130B fue entrenado y muchas de sus afinadas características llamaron la atención mundial; al mismo tiempo, la plataforma MaaS se lanzó (hoy bigmodel.cn), consiguiendo los primeros usuarios de API real. Luego, establecimos formalmente el Instituto de IA en la empresa, dedicado a la próxima generación de modelos grandes, y el departamento de plataforma MaaS para ofrecer servicios de API. A veces, hay que encontrar gente lo suficientemente soñadora (incluso dedicar más energía a buscarlos), y un objetivo audaz puede decidir la mitad del éxito.
En 2023, conversé con un reconocido emprendedor nacional sobre cómo la IA podría cambiar el futuro; coincidimos en que la IA revolucionaría las búsquedas y los navegadores, y que cada persona tendría un nuevo asistente de IA. Incluso, con ese asistente, ya no necesitaríamos tiendas de aplicaciones, sino crear una “API store” para IA, cuyo lógica de fondo podría revolucionar los sistemas operativos actuales. Quizá el cambio más grande sería la propia computadora, porque ya no la necesitaríamos para las personas, sino para la IA.
El significado de este cambio sería infinito, ya que remodelaría por completo la lógica subyacente de las computadoras y desafiaría el pilar básico de la informática durante 80 años: la arquitectura de Von Neumann. Al llegar a este punto de la charla, coincidimos en que aún no habíamos apostado lo suficiente por la IA, que no estábamos lo suficientemente “All-in”.
Pero la realidad es dura: el “All-in” no solo requiere convicción, sino también un apoyo financiero y de equipo extremadamente fuerte, y además, una previsión precisa. 2023 y 2024 fueron los años de explosión global de grandes modelos; las grandes empresas apostaron todo y en China hubo una ola emprendedora, luchas entre cientos de modelos y toda clase de asistentes de IA.
Quizás cometimos errores tanto técnicos como comerciales en ese momento. Ahora, analizando, puede que haya sido porque en la búsqueda del AGI a veces nos perdimos, distraídos por beneficios o modas a corto plazo. El AGI es una revolución tecnológica, y la tecnología debe ser democrática, abierta y beneficiar a todos.
La aparición de DeepSeek nos despertó. Cuando Wenfeng emprendió en 2023, hablamos del tema, y no me di cuenta de su determinación por el AGI. Le agradezco por hacerme pensar diferente. Apostar por la investigación en AGI y explorar sus límites, junto con una previsión precisa del futuro, son cosas que Zhipu debe seguir mejorando. Estos dos años nos han enseñado mucho y, aún más, han “reforzado” nuestra comprensión del AGI, la gobernanza empresarial y la competencia comercial.
El último año hicimos un “refuerzo” bastante sistemático. Lanzamos los lemas de “determinación” y “logro”, pidiendo a todos que mantengan la calma y la modestia, que no se subestimen y que logren tanto en su trabajo como en sí mismos.
Al principio del año todo era difícil: los modelos no alcanzaban el efecto esperado, había una guerra de precios en todo el país y encontrar el punto de ruptura era crucial para abrirse paso.
Mantuvimos nuestra posición y finalmente encontramos en el coding el punto de avance.
Si el lanzamiento de GLM-4.1 en abril fue una prueba simbólica, el de GLM-4.5 a fines de julio fue casi una batalla decisiva. Todos los equipos técnicos, de plataforma y de negocio trabajaron intensamente día y noche, y finalmente llegó una victoria largamente esperada. Luego, GLM-4.6 y GLM-4.7 pusieron nuestras capacidades de modelo al nivel de los mejores internacionales. Nuestro GLM-4.7 logró el SOTA en varios benchmarks como AA y Arena tanto en modelos open source como nacionales, y la experiencia real de coding y agentes por parte de los usuarios fue excelente. Más de 150 mil desarrolladores de 184 países usan el GLM Coding Plan; tras el lanzamiento de GLM-4.7, los ingresos anuales de la plataforma MaaS superaron los 500 millones (más de 200 millones provinieron del extranjero), y el salto de 20 a 500 millones (25 veces) tomó solo 10 meses.
En general, en el lado de los modelos, cumplimos según lo previsto la estrategia de lanzar en abril un modelo “de consolidación”, a mitad de año uno “para sentarse en la mesa”, y a fin de año un modelo Top 1. Esto sentó una base sólida para continuar avanzando hacia la cima tecnológica del AGI.
Nuestra “IA soberana” también avanzó: la plataforma nacional MaaS de Malasia se construyó sobre el modelo open source Z.ai, y GLM se convirtió en el modelo nacional de Malasia. La salida internacional de la IA soberana fue inspirada por la convocatoria del Secretario General de que “la IA china debe salir al mundo”, aunque sinceramente no sabía cómo hacerlo. Nuestro equipo internacional se atrevió a pelear y logró el hito de llevar un gran modelo chino al extranjero. En el negocio, nos atrevimos a competir y logramos de nuevo duplicar los ingresos anuales.
Frente a dificultades y oportunidades, hoy nos convertimos, de manera casi increíble, en la primera empresa de grandes modelos cotizada del mundo, lo que refleja el reconocimiento del mercado a nuestro valor tecnológico y comercial. “Make impossible possible” —¿lo recuerdan?
Quizá la mayor transformación este año no fue la de Zhipu, sino la de un grupo de jóvenes en la primera línea, que lograron muchas cosas que parecían imposibles.
En 2026, el objetivo de la empresa es ser líder internacional en grandes modelos. El último año, muchos discutieron sobre aplicaciones y ecosistemas en relación a los grandes modelos.
Pero lo que realmente determinará el panorama de la siguiente etapa serán dos cuestiones fundamentales: la arquitectura del modelo y el paradigma de aprendizaje. Al mismo tiempo, en el lado de las aplicaciones podría surgir una clara dirección: el año explosivo de la sustitución de diferentes oficios/tareas por parte de la IA.
Basados en este juicio, en 2026 nos enfocaremos en:
GLM-5. Muy pronto GLM-5 se presentará ante todos; con mejoras de escalado y mucha innovación tecnológica, creemos que GLM-5 ofrecerá muchas experiencias nuevas y permitirá a la IA ayudar a completar más tareas reales.
Nuevo diseño de arquitectura de modelo. La arquitectura Transformer, ampliamente usada durante casi 10 años, ya muestra algunas limitaciones, como el costo computacional para contextos ultralargos, mecanismos de memoria y actualización, entre otros. Es necesario explorar nuevas arquitecturas y paradigmas de escalabilidad, mejorando la eficiencia computacional mediante el diseño colaborativo entre chip y algoritmo.
RL con mayor capacidad de generalización. El paradigma RLVR, aunque exitoso en matemáticas y código, depende de entornos verificables artificiales, lo que limita su alcance. Este año exploraremos paradigmas de RL más generales, permitiendo que la IA no solo complete tareas bajo instrucciones humanas, sino que también entienda y ejecute tareas de largo plazo que duren horas o días.
La exploración más desafiante es iniciar el camino hacia el aprendizaje continuo y la evolución autónoma. Los modelos de IA actuales son básicamente estáticos tras su despliegue, obteniendo conocimientos a través de un proceso de entrenamiento único y costoso, y quedando obsoletos con el uso. Esto difiere totalmente del cerebro humano, que aprende y evoluciona constantemente mediante la interacción con el mundo. Debemos planificar con visión de futuro para el próximo paradigma de aprendizaje: aprendizaje en línea (Online Learning) o aprendizaje continuo (Continual Learning).
No somos una empresa tradicional, ni planeamos serlo. Queremos ser una compañía nativa de IA donde todo es posible: crear modelos de próxima generación con inteligencia creciente y desarrollar productos centrados en IA para servir a los usuarios. Queremos que la IA sea el mejor asistente de cada persona y ayude a cumplir tareas. Creemos que la IA también debe participar en la gobernanza de la empresa para reducir costos, aumentar eficiencia y garantizar mayor equidad.
Con el tiempo, una empresa suele acostumbrarse a hacer lo mismo y a realizar mejoras incrementales, lo cual limita la innovación. Pero en la era de la IA todo es disruptivo; necesitamos sentirnos un poco “incómodos” para mantener la innovación y proponer ideas revolucionarias que impulsen la próxima gran área de crecimiento.
Por eso creamos un nuevo departamento interno, X-Lab, dedicado a reunir a más jóvenes mediante un enfoque abierto para investigar la vanguardia: nuevas arquitecturas de modelo, nuevos paradigmas cognitivos y la incubación de nuevos proyectos, sin limitarse a software o hardware. También ampliaremos la inversión externa, no solo mediante alianzas estratégicas con empresas ya invertidas, sino también abriendo nuevos territorios para conectar toda la industria y prosperar juntos en el ecosistema. En X-Lab, la misión de cada uno es realizar innovaciones totalmente disruptivas, siempre regresando a la línea principal del AGI.
Hoy es un día emocionante en la vida de Zhipu, un hito histórico y el inicio de una nueva era. Me encanta la marca Z.ai: la Z es la última letra del alfabeto, representa el estado final, y queremos llegar al extremo último de la inteligencia en la búsqueda del AGI, ese es nuestro objetivo. Estamos muy entusiasmados:
- Tener un proyecto ambicioso que cambie el mundo
- Pensar a largo plazo y mirar hacia el futuro
- Ser más enfocados y explorar la esencia del AGI
- Impulsar el desarrollo de grandes empresarios y empresas con IA
- Aprovechar oportunidades empresariales con previsión precisa
- Y, finalmente, esperamos aportar una IA diferente a la sociedad humana y promover realmente el bienestar humano.
Es un momento de felicidad incomparable, y esa alegría no es solo dopamina momentánea, sino endorfinas acumuladas en el camino del AGI, que nos hacen estar más enfocados, con los pies en la tierra y avanzando continuamente.
Tang Jie
2026.1.8
Imagen principal: “Dune 2”
- FIN -
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
El entusiasmo por el ETF de Dogecoin se desvanece: ¿deberían los traders de DOGE prepararse para $0,12?

Transferencias encubiertas de criptomonedas de Irán evaden sanciones

Dan Ives: Las enormes inversiones en IA marcan solo el comienzo de la ‘Cuarta Revolución Industrial’
