In breve

  • La cinese Z.AI ha rilasciato un importante modello di generazione immagini open-source, addestrato interamente su chip Huawei.
  • Utilizza un design ibrido autoregressivo-diffusivo che migliora la precisione del testo e il controllo spaziale.
  • Il rilascio segnala la spinta della Cina verso l'autosufficienza nell'AI senza GPU statunitensi.

La società cinese di intelligenza artificiale Z.AI ha rilasciato mercoledì un modello open-source di generazione immagini addestrato interamente su processori Huawei, segnando la prima volta in cui un importante modello AI ha completato il suo intero ciclo di addestramento senza affidarsi a hardware americano.

L'iniziativa evidenzia una potenziale sfida a lungo termine al dominio di Nvidia nei chip AI, poiché dimostra che una delle principali aziende cinesi di intelligenza artificiale può addestrare grandi modelli senza affidarsi alle GPU prodotte negli Stati Uniti.

Il modello è già disponibile per il download e produce risultati buoni—anche se non sorprendenti secondo gli standard attuali—in termini di estetica e coerenza testuale, e mostra un'eccellente consapevolezza spaziale secondo i nostri primi rapidi test.

Z.AI della Cina lancia il primo importante modello di generazione di immagini AI addestrato senza chip americani image 0 Immagine generata con il nuovo modello di Z.AI.

L'azienda con sede a Pechino, che ha raccolto 558 milioni di dollari nella sua IPO a Hong Kong la scorsa settimana, ha addestrato il modello, chiamato GLM-Image, sui server Ascend Atlas 800T A2 di Huawei utilizzando il framework MindSpore.

"Speriamo che questo possa fornire un valido riferimento alla comunità per esplorare il potenziale della potenza di calcolo domestica", ha dichiarato Z.AI in una nota condivisa con il

South China Morning Post
.

Presentazione di GLM-Image: una nuova pietra miliare nella generazione di immagini open-source.

GLM-Image utilizza un'architettura ibrida autoregressiva più diffusione, combinando una forte comprensione semantica globale con un alto livello di dettaglio visivo. Eguaglia i principali modelli di diffusione per qualità complessiva…

— Z.ai (@Zai_org) 14 gennaio 2026

GLM-Image combina tecniche autoregressive e di diffusione in un’architettura ibrida con un totale di 16 miliardi di parametri. La componente autoregressiva, basata sul modello linguistico GLM-4 di Z.AI, gestisce la comprensione delle istruzioni e la composizione dell’immagine, mentre un decodificatore di diffusione affina i dettagli fini. Questo approccio rispecchia le tecniche utilizzate dall’ultimo modello di generazione immagini di OpenAI, gpt-image-1.5, che ha dimostrato una resa superiore del testo e una maggiore aderenza alle istruzioni rispetto ai modelli di sola diffusione come Stable Diffusion.

I modelli di diffusione creano immagini partendo da rumore visivo casuale che viene progressivamente raffinato in una figura, mentre i modelli autoregressivi costruiscono le immagini passo dopo passo, prevedendo ogni parte in base a quella precedente. La diffusione eccelle nella resa realistica globale ma può avere difficoltà con dettagli precisi come il testo o la disposizione, mentre i modelli autoregressivi sono eccellenti nella struttura e nel seguire le istruzioni. Attualmente, la diffusione è la tecnica principale tra i generatori di immagini AI open-source.

I nuovi sistemi ibridi combinano entrambi gli approcci, utilizzando la generazione autoregressiva per pianificare l’immagine e la diffusione per rifinire il risultato finale.

Z.AI della Cina lancia il primo importante modello di generazione di immagini AI addestrato senza chip americani image 1 Immagine: Z.AI

Il rilascio è significativo per Z.AI, che Washington ha inserito nella blacklist nel 2025 per presunti legami con l’esercito cinese. Tale designazione ha escluso la società dall’accesso ai processori Nvidia H100 e A100. Ora, Z.AI ha dimostrato che anche le aziende in blacklist possono produrre sistemi AI competitivi utilizzando hardware domestico, uno sviluppo che Pechino cerca da tempo di dimostrare.

Subito dopo l'annuncio di Z.AI,

Reuters
ha riferito che le autorità doganali cinesi avevano ordinato agli agenti di bloccare l'ingresso nel paese dei chip Nvidia H200. I funzionari governativi hanno convocato le aziende tecnologiche a riunioni dove è stato detto loro di non acquistare i chip se non strettamente necessario. Secondo le fonti, la formulazione era abbastanza severa da costituire "fondamentalmente un divieto per ora".

Pechino sembra voler comunicare che i laboratori di AI cinesi possono costruire modelli competitivi senza silicio americano, riducendo l'urgenza per le aziende cinesi di accumulare hardware Nvidia. L'H200, che offre circa sei volte le prestazioni del chip H20 che Pechino aveva già bloccato lo scorso agosto, aveva generato ordini da oltre due milioni di unità da parte delle aziende cinesi a 27.000 dollari ciascuna.

Gli analisti del Center for Security and Emerging Technologies della Georgetown University hanno osservato che la strategia cinese sui chip si basa sul compensare le prestazioni inferiori per chip con cluster massicci di processori Huawei. L’approccio funziona, ma richiede più hardware, più energia e maggiori sforzi ingegneristici.

"Uno dei principali vincoli di questa strategia è la capacità della Cina di produrre abbastanza chip a livello nazionale per colmare e mantenere il divario di capacità", ha dichiarato la senior research analyst Hanna Dohmen a

CNBC
in novembre.

Secondo la roadmap di Huawei, il suo chip di nuova generazione nel 2026 sarà in realtà inferiore all’attuale modello di punta in termini di potenza grezza. Tuttavia, tali valutazioni potrebbero sottovalutare ciò che i laboratori cinesi possono ottenere grazie all'efficienza algoritmica, come ha dimostrato DeepSeek addestrando modelli competitivi con meno chip tramite ottimizzazione a livello di assembly GPU.

Z.AI della Cina lancia il primo importante modello di generazione di immagini AI addestrato senza chip americani image 2 Fonte: Council on Foreign Relations

Secondo il rapporto tecnico dell’azienda, GLM-Image di Z.AI ha raggiunto punteggi di riferimento leader del settore tra i modelli open-source per la resa testuale e la generazione di caratteri cinesi. Chi non dispone dell’hardware necessario può provarlo online tramite API (al costo di $0,014 per immagine generata) o tramite uno spazio gratuito su Hugging Face gestito da Z.AI.

Z.AI è diventata la prima delle "tigri dell’AI" cinesi, un gruppo di startup che sviluppano grandi modelli linguistici per competere con OpenAI e Anthropic, a quotarsi in borsa. Il suo titolo è salito di circa l’80% dalla quotazione, seguendo l’entusiasmo degli investitori per aziende AI cinesi come DeepSeek o Alibaba, in un contesto di ambizioni nazionali sui chip.

Huawei, nel frattempo, si sta preparando ad aumentare drasticamente la produzione dei suoi processori Ascend quest’anno. La presenza dello stand dell’azienda alle conferenze AI in tutta la Cina è diventata sempre più prominente mentre cerca di posizionarsi come spina dorsale di un’infrastruttura AI nazionale che non dipende più da Santa Clara.