6 Min. Lesezeit
Die Governance-Lücke: Was KI-Agenten-geführte Unternehmen vor dem Skalieren richtig machen müssen

Bis Ende 2026 werden die meisten großen Unternehmen über eine digitale Belegschaft von mehr als 1.600 KI-Agenten verfügen. Diese Zahl stammt aus IBMs jüngster Unternehmensumfrage, vorgestellt auf Think 2026. Das klingt nach Fortschritt. Es ist Fortschritt, aber das ist nicht das ganze Bild.
Sieben von zehn Führungskräften sagen, dass die heute eingeführte KI-Governance nicht zweckmäßig ist. Nur 18 % der Unternehmen führen ein aktuelles, vollständiges Verzeichnis der Agenten, die bereits innerhalb ihrer Organisation laufen. Und nur 12 % verfügen über eine zentrale Plattform, um die Ausbreitung von Agenten zu steuern.
Das Muster ist aus jeder früheren Welle von Unternehmenstechnologie bekannt: Die Einführung überholt die Kontrolle. Aber bei KI-Agenten sind die Folgen schneller kumulativ. Ein unüberwachter RPA-Bot, der fehlfährt, erzeugt eine fehlerhafte Tabelle. Ein unüberwachter KI-Agent mit Produktionszugangsdaten kann eine Datenbank in neun Sekunden löschen.
Das Unternehmen mit 1.600 Agenten ist bereits da
IBMs Daten bestätigen, was die meisten Verantwortlichen im operativen Bereich bereits spüren: Agenten vermehren sich über Abteilungen, Teams und Anwendungsfälle hinweg, ohne dass eine einzige verantwortliche Stelle den Überblick behält.
Ein Deloitte TMT Predictions-Bericht schätzt, dass der Markt für autonome KI-Agenten bis Ende dieses Jahres 8,5 Milliarden US-Dollar erreichen und bis 2030 auf 35 Milliarden US-Dollar wachsen wird. Der OutSystems-Bericht zum Stand der KI-Entwicklung 2026, der 1.900 globale IT-Führungskräfte befragte, kam zu dem Ergebnis, dass 96 % der Unternehmen inzwischen einen gewissen Grad an Agenten-Einführung melden. Die durchschnittliche Organisation betreibt heute 12 Agenten; bis 2027 dürfte diese Zahl auf 20 steigen.
Doch die Einführung ist nicht das Problem. Die Koordination ist es. Jeder dieser Agenten wurde vermutlich von einem anderen Team mit einem anderen Framework sowie mit unterschiedlichen Berechtigungen, Logging-Standards und Eskalationsregeln entwickelt. Einige kommunizieren miteinander. Die meisten nicht. Keiner von ihnen berichtet an dasselbe Dashboard.
Das ist Agenten-Wildwuchs, und 94 % der Unternehmen sagen, dass sie bereits besorgt darüber sind.
Warum Governance in großem Maßstab versagt
Die Agenten-Governance scheitert aus demselben Grund wie Shadow IT: Die Tools lassen sich leicht bereitstellen und schwer nachverfolgen.
Ein Entwickler kann in einem Nachmittag einen Coding-Agenten aufsetzen. Ein Marketingteam kann innerhalb einer Woche drei Agenten mit seinem CRM, seiner E-Mail-Plattform und seinem Analytics-Stack verbinden. Ein Finanzteam kann Abstimmungen mit einem Modell automatisieren, das Lesezugriff auf Produktionshauptbücher hat. In den meisten Unternehmen erfordert keines davon eine Freigabe durch die zentrale IT. Und keines davon erscheint in einem einzigen Inventar.
Das Ergebnis ist das, was IBM als Governance-Lücke bezeichnet. Agenten arbeiten ohne gemeinsame Leitplanken. Wenn etwas schiefgeht, gibt es keine Prüfspur, die zeigt, welcher Agent welche Entscheidung getroffen hat, welche Daten er verwendet hat und an welchem Punkt im Workflow. In regulierten Branchen (Finanzwesen, Gesundheitswesen, Versicherungen) ist das nicht nur ein operatives Risiko. Es ist ein Compliance-Risiko.
Die IBV-Forschung von IBM ergab, dass 68 % der Führungskräfte befürchten, ihre KI-Initiativen könnten an unzureichender tiefer Integration scheitern. Nicht an unzureichenden Modellen, nicht an unzureichenden Daten. An unzureichender Integration zwischen den Agenten, den Systemen, mit denen sie interagieren, und der Governance-Ebene, die über beiden stehen sollte.
Die Orchestrierungsdividende
Die IBM-Daten zeigen auch eine klare Trennung zwischen Organisationen, die Governance als nachrangig behandelten, und solchen, die sie von Anfang an in das Fundament integriert haben.
Organisationen, die sich für eine orchestration-gestützte Governance entschieden hatten, waren 13-mal wahrscheinlicher dabei, ihre KI-Praxis zu skalieren, als Organisationen ohne diese Grundlage. Sie berichteten außerdem:
30 % weniger Unregelmäßigkeiten, was für ein Unternehmen mit 20 Milliarden US-Dollar Umsatz ungefähr 140 Millionen US-Dollar jährliche Einsparungen bedeutet
20 % höherer ROI aus ihren KI-Investitionen
169 % mehr Transparenz in die Entscheidungen und Aktionen der Agenten
132 % stärkerer Datenschutz
Das Muster deckt sich mit dem, was CIO Magazine berichtet hat in seiner Analyse des Agenten-Wildwuchses: Zentralisierte Orchestrierung ist kein Nice-to-have. Sie ist der Unterschied zwischen Agenten, die skalieren, und Agenten, die ins Stocken geraten.
Ein agentischer Workflow, der Agenten mit einer gemeinsamen Orchestrierungsebene verbindet, leistet drei Dinge, die eigenständige Agenten allein nicht können. Er erzwingt konsistente Berechtigungen und Eskalationsregeln für jeden Agenten im System. Er erstellt für jede Entscheidung, jeden Tool-Aufruf und jede Übergabe eine einheitliche Prüfspur. Und er ermöglicht es operativen Teams, jeden Agenten von einem zentralen Ort aus zu überwachen, anzuhalten oder umzuleiten.
88 % der Pilotprojekte scheitern vor dem Produktivgang. Meist ist Governance der Grund.
Die Think-2026-Daten fügen sich in ein breiteres Branchenmuster ein. Laut IDC-Forschung erreichen 88 % der KI-Agenten-Pilotprojekte nie die Produktion. Das Scheitern liegt selten am Modell. Es ist fast immer die Ebene um das Modell herum.
Agenten, die in einer Sandbox funktionieren, scheitern in der Produktion, weil dort echte Zugangsdaten, echte Kundendaten, echte Compliance-Anforderungen und echte Konsequenzen im Spiel sind. Ohne eine Governance-Ebene, die nachverfolgt, welcher Agent auf welches System mit welchen Berechtigungen und zu welchem Zeitpunkt zugegriffen hat, beendet die erste Sicherheitsprüfung das Projekt.
Die OutSystems-Daten bestätigen dies: Während 96 % der Unternehmen Agenten eingeführt haben, verfügen nur 12 % über eine zentrale Plattform zu ihrer Verwaltung. Der Rest baut Agenten Team für Team, Framework für Framework, in der Hoffnung, dass sich alles später zusammenfügt. IBMs Daten deuten darauf hin, dass das später nicht passieren wird. Es wird sich zu genau der technischen Schuld ausweiten, deren Abbau Jahre dauert.
Wie 13-fache Skalierung in der Praxis aussieht
IBM teilte eine Fallstudie, die den Unterschied verdeutlicht, den Orchestrierung in der Praxis macht.
Blue Pearl, ein Unternehmen, das eine Legacy-Java-Codebasis modernisierte, hatte 127 veraltete APIs zu aktualisieren. Der ursprüngliche Plan sah 14 Entwickler vor, die über neun Monate arbeiten sollten. Mit einem orchestrierten Agentensystem mit geeigneter Governance und Tool-Zugriff schlossen sie die Migration in drei Tagen ab.
Das ist keine Geschichte darüber, dass KI-Agenten schnell sind. Es ist eine Geschichte darüber, dass Agenten koordiniert werden. Jeder Agent hatte einen klar definierten Umfang, eindeutige Berechtigungen und ein gemeinsames führendes System. Kein Agent arbeitete außerhalb seines Verantwortungsbereichs. Die Orchestrierungsebene übernahm Routing, Sequenzierung und Validierung.
Ohne Orchestrierung würden 14 separate Agenten, die an 127 APIs arbeiten, genau den Wildwuchs erzeugen, vor dem IBM warnt: doppelte Arbeit, widersprüchliche Änderungen, keine einzige Quelle der Wahrheit und niemand, der die Frage "Was ist gerade passiert?" beantworten kann.
Die Entscheidung, vor der Unternehmen jetzt stehen
Das Unternehmen mit 1.600 Agenten ist keine Prognose für 2028 oder 2030. Es ist das Ende dieses Jahres. Die Frage ist, ob diese 1.600 Agenten als koordinierte digitale Belegschaft arbeiten oder als 1.600 unabhängige Programme, die 1.600 unabhängige Dinge ohne gemeinsame Governance tun.
IBMs Daten machen die Rechnung einfach. Organisationen, die in Orchestrierung investieren, skalieren 13-mal schneller, verlieren 30 % weniger durch Unregelmäßigkeiten und erzielen 20 % mehr Rendite auf ihre KI-Ausgaben. Organisationen, die darauf verzichten, schließen sich den 88 % an, deren Pilotprojekte nie die Produktion erreichen.
Der Unterschied zwischen den beiden Ergebnissen sind nicht mehr Agenten. Es ist das, was zwischen ihnen liegt.





