概要

  • 中国のZ.AIは、Huaweiのチップだけでトレーニングされた主要なオープンソース画像生成モデルを公開した。
  • このモデルはハイブリッドな自己回帰-拡散設計を用いており、テキストの正確性と空間制御を向上させている。
  • この公開は、米国製GPUなしでAI自立を目指す中国の取り組みを示している。

中国の人工知能企業Z.AIは水曜日、Huaweiプロセッサのみで完全にトレーニングされたオープンソース画像生成モデルを公開した。これは大規模AIモデルがアメリカ製ハードウェアに依存せず、完全なトレーニングサイクルを完了した初めての事例となる。

この動きは、米国製GPUに依存せずに中国の有力AI企業が大規模モデルをトレーニングできることを示し、AIチップ分野でのNvidiaの支配にとって潜在的な長期的課題となることを強調している。

このモデルはすでにダウンロード可能であり、審美性やテキストの一貫性に関しては現代の基準では特筆すべきものではないが、空間認識の面では非常に優れていることが我々の初期テストで明らかになった。

中国のZ.AI、アメリカ製チップを使わずに訓練した初の大規模AI画像生成モデルを発表 image 0 Z.AIの新モデルで生成された画像

北京を拠点とする同社は、先週香港でのIPOで5億5800万ドルを調達し、「GLM-Image」と呼ばれるこのモデルをHuaweiのAscend Atlas 800T A2サーバーとMindSporeフレームワークでトレーニングした。

「この取り組みが、国産の計算能力の可能性を探るコミュニティに有益な参考となることを願っています」とZ.AIは

南華早報(South China Morning Post)
に共有した声明で述べている。

GLM-Imageのご紹介:オープンソース画像生成分野における新たなマイルストーン。

GLM-Imageはハイブリッドな自己回帰+拡散アーキテクチャを採用し、強力なグローバルセマンティック理解と高精細なビジュアルディテールを両立しています。全体的な品質で主流の拡散モデルと同等…

— Z.ai (@Zai_org) 2026年1月14日

GLM-Imageは、合計160億パラメータを持つ自己回帰と拡散技術を組み合わせたハイブリッドアーキテクチャを採用している。自己回帰部分はZ.AIのGLM-4言語モデルに基づき、指示の理解や画像の構成を担当し、拡散デコーダが細部を洗練させる。この手法は、OpenAIの最新画像生成モデルgpt-image-1.5にも見られるもので、Stable Diffusionのような純粋な拡散モデルと比べ、優れたテキスト表現やプロンプト準拠性を示している。

拡散モデルは、ランダムなビジュアルノイズから徐々に画像を精緻化していくことで画像を生成し、自己回帰モデルは、前のパートから順に予測しながら段階的に画像を構築する。拡散法は全体的なリアリズムに優れるが、テキストやレイアウトのような精密なディテールでは苦戦する傾向がある。一方、自己回帰モデルは構造や指示の遵守に優れている。現時点では、拡散法がオープンソースAI画像生成の主流技術となっている。

新しいハイブリッドシステムは両方のアプローチを組み合わせ、自己回帰生成で画像を設計し、拡散で最終結果を磨き上げている。

中国のZ.AI、アメリカ製チップを使わずに訓練した初の大規模AI画像生成モデルを発表 image 1 画像:Z.AI

このリリースは、ワシントンが2025年に中国軍との関係を理由にZ.AIをブラックリストに追加し、NvidiaのH100とA100プロセッサとの接続を断ったことを踏まえると、Z.AIにとって大きな意味を持つ。今回、ブラックリスト入りした企業でも国産ハードウェアで競争力のあるAIシステムを生み出せることをZ.AIは証明し、これは北京が長年示そうとしてきた進展である。

Z.AIの発表直後、

ロイター
は、中国税関当局がNvidiaのH200チップの国内流入を阻止するよう職員に指示したと報じた。政府関係者はテクノロジー企業を招集し、必要がなければこれらのチップを購入しないよう指示した。関係者によれば、その言葉遣いは「現時点では事実上の禁止」に相当するほど厳しいものだったという。

北京は、中国のAI研究所がアメリカ製半導体なしで有能なモデルを構築できることを示し、中国の企業がNvidiaハードウェアを備蓄する緊急性を弱めようとしているようだ。H200は、昨年8月に北京がすでに規制したH20チップの約6倍の性能を持ち、中国企業から200万個超、1個あたり2万7千ドル以上の注文があった。

ジョージタウン大学のCenter for Security and Emerging Technologiesのアナリストらは、中国の半導体戦略が、1チップあたりの性能が低い分をHuaweiプロセッサの大規模クラスタで補うことに依存していると指摘している。この方法は効果があるが、より多くのハードウェア、電力、エンジニアリング努力を必要とする。

「この戦略の主な制約の1つは、中国が能力のギャップを埋め、維持するのに十分なチップを国内生産できるかどうかです」と上級リサーチアナリストのHanna Dohmenは

CNBC
に 11月語った。

Huawei自身のロードマップによれば、2026年の次世代チップは実際には現行フラッグシップよりも純粋な性能で劣る見込みだ。しかし、DeepSeekがアセンブリレベルのGPU最適化によってより少ないチップで競争力あるモデルをトレーニングしたように、アルゴリズム効率を通じて中国の研究所が達成できることを過小評価している可能性がある。

中国のZ.AI、アメリカ製チップを使わずに訓練した初の大規模AI画像生成モデルを発表 image 2 出典:Council on Foreign Relations

Z.AIのGLM-Imageは、同社の技術報告書によれば、オープンソースモデルの中でテキストレンダリングや中国語文字生成において業界最高水準のベンチマークスコアを達成した。適切なハードウェアを持たない人も、1枚生成あたり0.014ドルのAPIアクセスや、Z.AIが提供する無料のHugging Face Spaceでオンライン試用が可能だ。

Z.AIは、中国版「AIタイガース」と呼ばれる、OpenAIやAnthropicに対抗する大規模言語モデルを開発するスタートアップの中で初の上場企業となった。同社の株価は上場以来約80%上昇しており、中国の半導体自立の野心を背景にDeepSeekやAlibabaなどの中国AI企業への投資家の期待が高まっている。

一方Huaweiは、今年Ascendプロセッサの生産を大幅に増やす準備を進めている。同社は中国各地で開催されるAIカンファレンスでの存在感を高めており、Santa Claraに依存しない国家AIインフラの中核としての地位を確立しようとしている。