4 Min. Lesezeit
NVIDIAs Marktanteil in China sank von 95 % auf null. Die 12-Milliarden-Dollar-Frage lautet: Wer hat die Lücke gefüllt?

Vor zwei Jahren hielt Nvidia 95 % von Chinas Markt für KI-Beschleuniger. Auf der GTC 2026 sagt Jensen Huang, diese Zahl sei null.
Nicht rückläufig. Nicht unter Druck. Null. Nvidia verbuchte allein im ersten Geschäftsjahresquartal 2026 Abschreibungen in Höhe von 4,5 Milliarden US-Dollar im Zusammenhang mit Exportbeschränkungen. China machte früher 20-25 % von Nvidias Rechenzentrumsumsatz aus. Diese Position ist inzwischen eine Abschreibung.
Die Geschichte, die alle erzählen, handelt von Handelspolitik und Geopolitik. Die wichtigere Geschichte für alle, die mit KI-Agenten arbeiten, ist das, was danach geschah: China hat nicht gewartet. Es hat gebaut.
Huaweis Antwort über 12 Milliarden US-Dollar
Als Nvidias Zugang geschlossen wurde, öffnete sich der von Huawei. Der KI-Chip-Umsatz des Unternehmens wird für 2026 auf 12 Milliarden US-Dollar prognostiziert, ein Plus von 60 % gegenüber 7,5 Milliarden US-Dollar im Jahr 2025. Das ist kein Rundungsfehler. Das ist ein neuer Marktführer, der sich in Echtzeit formiert.
Die zugrunde liegende Hardware ist der Ascend 950PR, der im März in die Massenproduktion gegangen ist. Er liefert bis zu 2 Petaflops FP4-Leistung mit 128 GB lokal produziertem HBM-Speicher. Eine aktualisierte Version, der 950DT, wird für Q4 2026 mit 144 GB HBM erwartet. Für Inference-Workloads, also genau dort, wo die meisten produktiven KI-Agenten tatsächlich laufen, ist der 950PR konkurrenzfähig genug, dass chinesische Hyperscaler ihre Infrastruktur darum herum aufbauen, statt auf das Auslaufen der Sanktionen zu warten.
Huawei ist auf Kurs, bis zum Jahresende 60 % von Chinas KI-Chip-Markt zu kontrollieren. Dahinter bauen sich Cambricon, Moore Threads und MetaX ihre eigenen Positionen auf. Der adressierbare Gesamtmarkt für KI-Beschleuniger in China wird für 2026 auf 30-35 Milliarden US-Dollar prognostiziert. Keiner dieser Ausgaben fließt an amerikanische Unternehmen.
Das CUDA-Problem, über das niemand spricht
Chips sind die Schlagzeile. Software ist die eigentliche Geschichte.
Seit über einem Jahrzehnt ist Nvidias CUDA-Plattform die Standard-Programmierebene für KI-Workloads. Nahezu jedes große Modell, jede Training-Pipeline, jeder Inference-Stack wurde auf CUDA aufgebaut. Entwickler lernten es in der Ausbildung. Unternehmen bauten ihre internen Tools darum herum. Die Wechselkosten sollten Nvidias dauerhafter Burggraben sein.
Exportkontrollen haben diesen Burggraben in China zerstört. Wenn chinesische Entwickler keine Nvidia-Hardware mehr kaufen können, schreiben sie keinen CUDA-Code mehr. Stattdessen bauen sie auf Huaweis Ascend-Ökosystem auf, auf CANN (Compute Architecture for Neural Networks), auf MindSpore, auf einem Software-Stack, der vor drei Jahren in dieser Größenordnung noch nicht existierte.
Jensen Huang brachte es ausdrücklich auf den Punkt: „Ein ganzer Markt in der Größe Chinas aufzugeben, ergibt strategisch wahrscheinlich nicht viel Sinn. Ich denke, das ist bereits weitgehend nach hinten losgegangen.“ Seine Sorge gilt nicht den Hardware-Umsätzen, die Nvidia verloren hat. Es geht um das Software-Ökosystem, das China gewinnt. Wenn chinesische Entwickler auf Ascend statt auf CUDA aufbauen, schaffen sie einen alternativen Stack, der dann global exportiert werden kann.
Zwei KI-Stacks, nicht einer
Das praktische Ergebnis ist eine Aufspaltung. Die US-amerikanische KI-Infrastruktur läuft auf Nvidia. Die chinesische KI-Infrastruktur läuft auf Huawei. Beide Ökosysteme entwickeln sich nun unabhängig weiter, mit eigener Hardware, eigenen Software-Schichten und eigenen Optimierungsmustern.
Für Unternehmen, die KI-Agenten bereitstellen, ist das relevant, und zwar weit über die Geopolitik hinaus. Anbieter von Modellen driften bereits auseinander. DeepSeek, Qwen und andere Modelle chinesischen Ursprungs werden auf Ascend-Hardware trainiert und optimiert. Westliche Modelle laufen auf Nvidia. Wenn Ihre Agenten-Orchestrierung an ein einziges Hardware-Ökosystem gebunden ist, verlieren Sie den Zugang zu der Hälfte der Modelle, die gerade entstehen.
Genau hier werden hardware-agnostische Agentenplattformen nicht nur zu einer Bequemlichkeit, sondern zu einem strukturellen Vorteil. Ein Agent, der mit jedem Modell läuft, unabhängig davon, auf welchem Silizium es trainiert wurde, ist es egal, ob der nächste Durchbruch aus Santa Clara oder Shenzhen kommt.
Was Abschreibungen in Höhe von 4,5 Milliarden US-Dollar tatsächlich bewirkt haben
Die US-Exportkontrollen haben ihr erklärtes Ziel erreicht: China hat keinen Zugang zu Nvidias neuesten Chips. Doch die Folgen zweiter Ordnung sind schwerer zu feiern.
Chinas heimischer Markt für KI-Chips ist in weniger als drei Jahren von nahezu null auf geschätzte 30-35 Milliarden US-Dollar gewachsen. Huawei hat einen konkurrenzfähigen Inference-Chip und den dazugehörigen Software-Stack entwickelt. Chinesische Hyperscaler wie ByteDance, Alibaba und Tencent bauten ihre Training-Pipelines auf heimischer Hardware auf, weil sie keine andere Wahl hatten. Die Cyberspace Administration Chinas wies die heimischen Unternehmen dann an, überhaupt keine Nvidia-Chips mehr zu bestellen, selbst nachdem die USA einige Beschränkungen gelockert hatten. Die Tür schloss sich von beiden Seiten.
Nvidias Abschreibung in Höhe von 4,5 Milliarden US-Dollar finanzierte die Entstehung eines parallelen KI-Ökosystems. Eines, das keine amerikanische Hardware benötigt. Eines, das seine eigenen Software-Standards entwickelt. Und eines, das in den nächsten zehn Jahren global mit CUDA konkurrieren wird.
Was das für Enterprise-KI bedeutet
Die 95-zu-null-Geschichte ist dramatisch, aber die strategische Frage ist einfacher: Wo soll Ihre KI-Infrastruktur verankert sein?
Unternehmen, die auf einen einzelnen Modellanbieter, einen einzelnen Hardware-Vendor oder ein einzelnes Ökosystem setzen, wetten auf eine Seite einer Aufspaltung, die bereits im Gange ist. Die Unternehmen, die am Ende vorne liegen, werden diejenigen sein, deren Agenten-Infrastruktur jedes Modell auf jeder Hardware ausführen kann und bei veränderten Lieferketten flexibel umschaltet.
Der Chipkrieg ist eine Hardware-Geschichte. Die eigentliche Frage ist, ob Ihr KI-Stack flexibel genug ist, um ihn zu überstehen.





