02.06.2026

7 Min. Lesezeit

NVIDIA Computex 2026: Was die Ankündigungen zu KI-Agenten für Unternehmen bedeuten

von

Fredrik Falk

Kategorie

KI-Agenten

Artikel teilen

NVIDIA nutzte die Computex 2026, um in einer einzigen Keynote gleich sechs Produkte im Bereich KI-Agenten anzukündigen: eine zweckgebundene CPU, ein offenes Modell mit 500 Milliarden Parametern, ein Orchestrierungs-Framework, eine sichere Runtime, einen Consumer-Superchip und ein multimodales Edge-Modell. Die meiste Berichterstattung konzentrierte sich auf den Aktienkurs und den RTX Spark Laptop-Chip.

Für Unternehmensteams, die tatsächlich KI-Agenten implementieren, ist die Consumer-Hardware nicht die eigentliche Story. Drei der sechs Ankündigungen verändern die Bereitstellungskalkulation in einer Weise, die Aufmerksamkeit verdient. Doch zunächst einmal das, was NVIDIA tatsächlich auf den Markt gebracht hat – befreit von der Marketing-Sprache der Keynote.

Was NVIDIA angekündigt hat

Die Vera CPU ist ein speziell entwickelter Prozessor für agentenbasierte KI- und Reinforcement-Learning-Workloads. Im Vergleich zu herkömmlichen x86-Server-CPUs verspricht NVIDIA eine doppelt so hohe Effizienz und eine um 50 % schnellere Leistung. Zu den Early Adoptern gehören OpenAI, Anthropic und SpaceX. Dies ist ein Produkt für das Rechenzentrum: Vera wurde für Server-Racks entwickelt, auf denen Tausende paralleler Agenten-Sitzungen laufen, nicht für Ihren Laptop.

Nemotron 3 Ultra ist das neue Open-Weights-Modell von NVIDIA. Es umfasst 500 Milliarden Parameter und nutzt eine Mixture-of-Experts-Architektur, bei der etwa 50 Milliarden Parameter pro Token aktiv sind. Es liefert über 300 Output-Token pro Sekunde – eine bis zu 5-mal schnellere Inferenz als vergleichbare Frontier-Modelle – bei rund 30 % geringeren Betriebskosten. Das Modell ist speziell auf die Art von mehrstufigem logischem Denken (Reasoning) abgestimmt, das Agenten benötigen, wenn sie Aufgaben über lange Zeithorizonte hinweg planen, ausführen und selbst korrigieren. Die offenen Gewichte und Trainingsrezepte bedeuten, dass Unternehmen das Modell mit ihren eigenen Daten feintunen können.

NemoClaw ist ein Orchestrierungs-Framework, im Wesentlichen eine Vorlage dafür, wie Agenten planen, argumentieren, ausführen und delegieren. Wenn Sie bereits Agenten entwickelt haben, können Sie sich dies als strukturierte Alternative dazu vorstellen, eigene ReAct-Schleifen und Tool-Aufrufketten von Grund auf neu zu schreiben. NemoClaw wird mit Templates für gängige Unternehmens-Use-Cases ausgeliefert: Aufgabendekomposition, Delegation zwischen mehreren Agenten sowie Tool-Aufrufe mit Fehlerbehebung.

OpenShell ist die Sicherheits- und Governance-Ebene. Sie bietet eine Sandbox-Runtime, in der Unternehmen definieren können, was ein Agent tun darf, was er nicht anfassen darf und was eine menschliche Genehmigung erfordert. Dies ist der Teil, der den meisten Agenten-Frameworks völlig fehlt. Man kann mit fast jedem Modell einen fähigen Agenten bauen, aber das, was er zur Laufzeit tut, so zu steuern, dass es Compliance-Teams zufriedenstellt, ist ein ganz anderes Problem. OpenShell kommt durch eine Partnerschaft mit Microsoft auch für Windows, was für das Thema RTX Spark für Endverbraucher wichtig, für die Bereitstellung auf Unternehmensservern jedoch weniger relevant ist.

RTX Spark ist ein Superchip für Laptops, der eine Arm-CPU und eine Blackwell-GPU mit bis zu 128 GB Unified Memory und 1 Petaflop KI-Leistung kombiniert. Zu den Partnern gehören Dell, HP, Lenovo, Microsoft, ASUS und MSI. Die Systeme kommen im Herbst 2026 auf den Markt. Dies ist ein Produkt für Consumer und Entwickler: lokale Agenten, die direkt auf dem Gerät laufen, ohne von der Cloud abhängig zu sein.

Nemotron 3 Nano Omni ist ein kleineres multimodales Modell, das Sehen, Hören und Sprache in einem System vereint. Es ist für Edge- und On-Device-Szenarien konzipiert, in denen ein Agent sehen, hören und antworten können muss, ohne alle Daten über die Cloud zu leiten.

Was das für KI-Teams in Unternehmen bedeutet

Das ist die Produktliste. Nun zu dem Teil, den die meiste Computex-Berichterstattung auslässt: Was ändert sich tatsächlich für Teams, die KI-Agenten in der Produktion einsetzen?

1. Offene Gewichte auf Frontier-Niveau verändern die Abwägung zwischen Eigenentwicklung und Einkauf.

Vor Nemotron 3 Ultra mussten Unternehmen, die sich für offene Modelle für ihre Agenten entschieden, im Vergleich zu GPT-4.5 oder Claude Opus deutliche Leistungseinbußen in Kauf nehmen. Llama war zwar konkurrenzfähig, aber nicht speziell für agentenbasierte Workloads optimiert. Nemotron 3 Ultra ist das erste offene Modell auf Frontier-Niveau, das von Grund auf für mehrstufiges logisches Denken von Agenten entwickelt wurde. Eine 5-mal schnellere Inferenz und 30 % geringere Kosten sind keine marginalen Verbesserungen. Sie verändern, welche Workflows als Agenten-Aufgaben wirtschaftlich rentabel sind. Ein Rechnungsprüfungs-Agent, der bei GPT-4.5-Preisen 0,40 $ pro Durchlauf kostet, könnte bei Nemotron 3 Ultra nur 0,28 $ kosten. Bei Tausenden von täglichen Durchläufen summiert sich das schnell.

2. Für Sicherheit und Governance gibt es jetzt eine Standardlösung.

Das größte Hindernis bei der Einführung von Agenten in Unternehmen ist nicht die Leistungsfähigkeit des Modells. Es ist die Sicherheitsprüfung. Wenn ein CISO nach den Kontrollmechanismen für das Laufzeitverhalten eines Agenten fragt, haben die meisten Teams keine gute Antwort parat, abgesehen von „wir haben Guardrails per Prompt-Engineering definiert“. OpenShell bietet eine strukturierte, richtliniengesteuerte Sandbox: Berechtigungen definieren, Tool-Zugriffe einschränken und Freigaben durch Menschen für risikoreiche Aktionen vorschreiben. Es ist nicht der einzige Ansatz für Agenten-Sicherheit im Produktivbetrieb, aber es ist der erste, der standardmäßig in den Stack eines großen Anbieters integriert ist. Das erleichtert Sicherheitsgespräche mit Compliance-Teams erheblich.

3. Orchestrierungs-Frameworks werden zur Standardware. Die Orchestrierung echter Workflows hingegen nicht.

NemoClaw reiht sich ein neben LangGraph, CrewAI, AutoGen und eine wachsende Liste von Frameworks zur Agenten-Orchestrierung. Die Tools, um eine Agentenschleife aufzusetzen, Tools aufzurufen und Fehler zu beheben, werden immer mehr zum Standard. Wenn Cadence, Dassault Systemes, Siemens und Synopsys autonome Engineering-Agenten bauen, die wochenlange Simulationsarbeit auf wenige Stunden verkürzen, ist das Orchestrierungs-Framework der einfache Teil. Die Herausforderung besteht darin, diese Agenten mit proprietären Systemen zu verbinden, sie mit domänenspezifischen Daten zu trainieren, ihre Genauigkeit im Laufe der Zeit aufrechtzuerhalten und sie im Rahmen bestehender Compliance-Anforderungen zu betreiben. Hier liegt der eigentliche Aufwand bei der Implementierung, und kein Open-Source-Framework löst das out of the box.

Was Unternehmensteams getrost ignorieren können

Nicht jede Ankündigung von NVIDIA ist gleichermaßen wichtig, wenn Sie Agenten für Geschäftsprozesse bereitstellen, anstatt KI-Infrastruktur aufzubauen.

RTX Spark ist beeindruckende Hardware, aber die lokale Ausführung von Agenten auf Laptops löst keine Enterprise-Probleme. Agenten in Unternehmen laufen auf Servern, greifen auf interne Datenbanken zu und benötigen zentralisierte Protokollierung und Audit-Trails. Ein Entwickler, der einen lokalen Agenten auf seinem Laptop ausführt, ist ein Produktivitätswerkzeug, keine Enterprise-Lösung.

Vera CPU ist wichtig für Hyperscaler und Unternehmen, die eine eigene private KI-Infrastruktur aufbauen. Für die Mehrheit der Unternehmen, die Agenten über Plattformen oder Managed Services implementieren, ist die darunter liegende CPU abstrahiert. Sie profitieren von Vera indirekt durch niedrigere Kosten Ihres Cloud-Anbieters, nicht indem Sie die Chips selbst kaufen.

Das Self-Hosting von Nemotron 3 Ultra ist für die meisten Teams nicht der richtige Weg. Das Feintuning und der Betrieb eines 500B-Modells erfordern eine massive GPU-Infrastruktur. Die meisten Unternehmen werden mehr Wert aus Agenten-Plattformen ziehen, die die Modellebene abstrahieren, sodass sich die Teams auf das Workflow-Design, die Systemintegration und die kontinuierliche Optimierung konzentrieren können, anstatt sich mit der Bereitstellung von GPUs zu beschäftigen.

Was dies für die KI-Agenten-Strategie von Unternehmen bedeutet

Dass NVIDIA Open-Source-Modelle, Frameworks und Runtimes kostenlos zur Verfügung stellt, ist kein reiner Altruismus. Jedes Unternehmen, das NemoClaw oder Nemotron einführt, benötigt NVIDIA-GPUs, um diese zu betreiben. Jeder Entwickler, der lokale Agenten auf RTX Spark erstellt, benötigt NVIDIA-Chips. Kostenlose Software kurbelt die Hardware-Nachfrage an. Das ist eine bewährte Strategie.

Für Unternehmen sind das eigentlich gute Nachrichten. Die Kosten für die zugrunde liegende Agenten-Infrastruktur, die Modelle, die Orchestrierungs-Tools und die sicheren Runtimes sinken rasant. Die Hürde für den Einstieg in das Thema KI-Agenten war noch nie so niedrig.

Aber der Einstieg und das Erzielen von echtem Geschäftswert sind zwei verschiedene Dinge. Die von NVIDIA angekündigte Infrastrukturebene löst die Frage: „Kann ich einen Agenten betreiben?“. Sie löst jedoch nicht die Frage: „Funktioniert dieser Agent auch tatsächlich für meinen Kreditorenbuchhaltungsprozess?“, oder „Bleibt dieser Agent präzise, wenn sich unsere Daten ändern?“, oder „Kann ich unserem Compliance-Team beweisen, dass dieser Agent kontrolliert gesteuert wird?“.

Dies sind Workflow-Probleme, keine Infrastrukturprobleme. Sie erfordern es, Agenten mit Ihren spezifischen Systemen zu verbinden, sie mit Ihren Domänendaten zu trainieren, Feedbackschleifen aufzubauen, die sie im Laufe der Zeit präzise halten, und überall dort, wo es darauf ankommt, menschliche Aufsicht zu integrieren. Diese Ebene liegt über all dem, was NVIDIA angekündigt hat, und hier liegt der eigentliche Aufwand bei der Implementierung.

Nach der Computex 2026 gibt es keine Ausreden mehr auf Infrastrukturebene, keine KI-Agenten einzuführen. Die Frage ist nun, ob Ihre Agenten für die Workflows gebaut sind, die tatsächlich den Geschäftswert steigern, und nicht nur, ob sie auf der neuesten Hardware laufen.

Heute starten

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Nutzen Sie jetzt unsere Plattform und beginnen Sie mit der Entwicklung von KI-Agenten für verschiedene Arten von Automatisierungen

Heute starten

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Nutzen Sie jetzt unsere Plattform und beginnen Sie mit der Entwicklung von KI-Agenten für verschiedene Arten von Automatisierungen

Plattform

Lösungen

Unsere Kunden

Ressourcen

Über uns

NVIDIA Computex 2026: Was die Ankündigungen zu KI-Agenten für Unternehmen bedeuten

von

Fredrik Falk

Kategorie

KI-Agenten

Artikel teilen

Was NVIDIA angekündigt hat

Was das für KI-Teams in Unternehmen bedeutet

Was Unternehmensteams getrost ignorieren können

Was dies für die KI-Agenten-Strategie von Unternehmen bedeutet

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Neueste Artikel

GPT-5.6 Sol Hits 750 Tokens a Second. Agent Latency Just Became a Buying Decision

Beam vs Bullhorn Automation: Which One Actually Fits Modern Staffing Firms in 2026?

The 2026 BPO Automation Benchmark: Why the 25% Handling-Time Ceiling Is the Wrong Number

GPT-5.6 Sol Hits 750 Tokens a Second. Agent Latency Just Became a Buying Decision

Beam vs Bullhorn Automation: Which One Actually Fits Modern Staffing Firms in 2026?

The 2026 BPO Automation Benchmark: Why the 25% Handling-Time Ceiling Is the Wrong Number

Was ist MCP? Model Context Protocol für KI-Agenten erklärt