En bref
- Z.AI, société chinoise, a publié un important modèle d’image open-source entièrement entraîné sur des puces Huawei.
- Il utilise une architecture hybride auto-régressive-diffusion qui améliore la précision du texte et le contrôle spatial.
- Cette sortie marque la volonté de la Chine de s’orienter vers l’autonomie en IA sans GPU américains.
La société chinoise d'intelligence artificielle Z.AI a publié mercredi un modèle open-source de génération d'images entièrement entraîné sur des processeurs Huawei, marquant la première fois qu'un grand modèle d'IA termine son cycle d'entraînement complet sans recourir à du matériel américain.
Cette initiative met en lumière un défi potentiel à long terme pour la domination de Nvidia sur les puces IA, car elle montre qu'une des principales entreprises d'IA chinoises peut entraîner de grands modèles sans dépendre des GPU américains.
Le modèle est déjà disponible en téléchargement et génère des résultats corrects — bien que pas impressionnants selon les standards actuels — en termes d’esthétique et de cohérence textuelle, tout en montrant une excellente gestion de l’espace selon nos premiers tests rapides.

Image générée avec le nouveau modèle de Z.AI.
L'entreprise basée à Pékin, qui a levé 558 millions de dollars lors de son introduction en bourse à Hong Kong la semaine dernière, a entraîné le modèle, nommé GLM-Image, sur les serveurs Ascend Atlas 800T A2 de Huawei en utilisant le framework MindSpore.
« Nous espérons que cela pourra servir de référence précieuse pour la communauté afin d’explorer le potentiel de la puissance de calcul domestique », a déclaré Z.AI dans un communiqué partagé avec le
South China Morning Post
.
Présentation de GLM-Image : une nouvelle étape dans la génération d’images open-source.
GLM-Image utilise une architecture hybride auto-régressive et diffusion, combinant une forte compréhension sémantique globale avec un niveau de détail visuel élevé. Elle rivalise avec les modèles de diffusion courants en termes de qualité globale…
— Z.ai (@Zai_org) 14 janvier 2026
GLM-Image combine des techniques auto-régressives et de diffusion dans une architecture hybride totalisant 16 milliards de paramètres. La partie auto-régressive, basée sur le modèle linguistique GLM-4 de Z.AI, gère la compréhension des instructions et la composition de l’image, tandis qu’un décodeur de diffusion affine les détails. Cette approche reflète les techniques utilisées par le dernier modèle de génération d’images d’OpenAI, gpt-image-1.5, qui a démontré une supériorité dans le rendu du texte et l’adhésion aux prompts par rapport à des modèles purement diffusion comme Stable Diffusion.
Les modèles de diffusion produisent des images en partant d’un bruit visuel aléatoire qu’ils affinent peu à peu pour obtenir une image, tandis que les modèles auto-régressifs construisent l’image étape par étape, en prédisant chaque partie sur la base des précédentes. La diffusion excelle dans le réalisme global mais peut peiner à gérer des détails précis comme le texte ou la mise en page, alors que les modèles auto-régressifs excellent dans la structure et la compréhension des instructions. Actuellement, la diffusion est la technique dominante parmi les générateurs d’images IA open-source.
Les nouveaux systèmes hybrides combinent les deux approches, utilisant la génération auto-régressive pour planifier l’image et la diffusion pour peaufiner le résultat final.

Image : Z.AI
Cette sortie est significative pour Z.AI, que Washington a placé sur liste noire en 2025 pour de supposés liens avec l’armée chinoise. Cette désignation a privé l’entreprise des processeurs H100 et A100 de Nvidia. Aujourd’hui, Z.AI prouve que les sociétés sanctionnées peuvent tout de même produire des systèmes IA compétitifs avec du matériel domestique, un développement que Pékin cherchait depuis longtemps à démontrer.
Juste après l’annonce de Z.AI,
Reuters
a rapporté que les autorités douanières chinoises avaient donné pour instruction à leurs agents de bloquer l’entrée des puces Nvidia H200 dans le pays. Des responsables gouvernementaux ont convoqué des entreprises technologiques à des réunions où il leur a été dit de ne pas acheter ces puces sauf nécessité absolue. Selon des sources, le ton employé équivalait à « pratiquement une interdiction pour l’instant ».
Pékin semble indiquer que les laboratoires d’IA chinois sont capables de construire des modèles performants sans silicium américain, réduisant ainsi l’urgence pour les entreprises chinoises de faire des stocks de matériel Nvidia. La H200, qui offre environ six fois les performances de la puce H20 déjà bloquée par Pékin en août dernier, avait suscité plus de deux millions de commandes de la part d’entreprises chinoises au prix de 27 000 dollars pièce.
Les analystes du Center for Security and Emerging Technologies de Georgetown ont noté que la stratégie chinoise en matière de puces repose sur la compensation de la moindre performance par puce par d’énormes grappes de processeurs Huawei. Cette approche fonctionne, mais nécessite davantage de matériel, plus d’énergie et plus d’efforts d’ingénierie.
« L’une des principales limites de cette stratégie est la capacité de la Chine à produire suffisamment de puces localement pour combler et maintenir l’écart de performance », a déclaré Hanna Dohmen, analyste principale, à
CNBC
en novembre.
Selon la feuille de route de Huawei, sa prochaine puce en 2026 serait en réalité moins puissante que son modèle phare actuel en termes de puissance brute. Mais de telles évaluations pourraient sous-estimer ce que les laboratoires chinois peuvent accomplir grâce à l’efficacité algorithmique, comme l’a montré DeepSeek en entraînant des modèles compétitifs avec moins de puces via l’optimisation GPU au niveau assembleur.

Source : Council on Foreign Relations
D’après le rapport technique de l’entreprise, GLM-Image de Z.AI a atteint des scores de référence de pointe parmi les modèles open-source pour le rendu du texte et la génération de caractères chinois. Ceux qui ne disposent pas du matériel requis peuvent également le tester en ligne via un accès API à 0,014 $ par image générée, ou via un Hugging Face Space gratuit maintenu par Z.AI.
Z.AI est devenue la première des « tigres de l’IA » chinois, un groupe de startups développant de grands modèles de langage pour rivaliser avec OpenAI et Anthropic, à entrer en bourse. Son action a grimpé d'environ 80 % depuis son introduction, portée par l’enthousiasme des investisseurs pour des entreprises d’IA chinoises comme DeepSeek ou Alibaba alors que la Chine nourrit de grandes ambitions pour ses propres puces.
Huawei, de son côté, se prépare à augmenter fortement la production de ses processeurs Ascend cette année. La présence de l’entreprise dans les salons IA à travers la Chine est de plus en plus visible, alors qu’elle cherche à s’imposer comme l’épine dorsale d’une infrastructure nationale d’IA qui ne dépend plus de Santa Clara.