13.05.2026

7 Min. Lesezeit

Wie Sie Ihre KI-Agenten vor einer unternehmensweiten Sicherheitsprüfung auditieren

von

Fredrik Falk

Traditionelle Software tut bei jedem Ausführen dasselbe. Das macht sie prüfbar. Ein KI-Agent tut das nicht. Er schlussfolgert, wählt Werkzeuge aus und führt Aktionen aus, die sich mit jeder Eingabe unterscheiden. Das macht ihn nützlich. Es ist auch der Grund, warum Ihr bestehender Security-Review-Prozess nicht dafür konzipiert wurde.

Im Dezember 2025 veröffentlichte OWASP seine erste Top 10 für agentenbasierte Anwendungen, entwickelt von über 100 Sicherheitsexperten und mit Risiken speziell für autonome KI-Agenten. NIST startete im Februar 2026 eine AI Agent Standards Initiative. Microsoft veröffentlichte im April 2026 ein Open-Source-Agent-Governance-Toolkit, das alle 10 OWASP-Agentenrisiken mit Laufzeitdurchsetzung adressiert. Die Frameworks existieren jetzt. Ihre Agenten müssen dafür bereit sein.

Warum Agenten-Audits sich von Anwendungs-Audits unterscheiden

Ein standardmäßiges Application-Security-Audit prüft Eingaben, Ausgaben, Zugriffskontrollen und Datenflüsse. Die Anwendung verhält sich bei derselben Eingabe jedes Mal gleich, sodass Sie sie systematisch testen können.

KI-Agenten brechen diese Annahme. Das Verhalten eines Agenten hängt von dem Prompt ab, den er erhält, vom Kontext, den er abruft, von den verfügbaren Werkzeugen und vom Schlussfolgerungspfad, den er einschlägt. Dieselbe Eingabe kann bei aufeinanderfolgenden Ausführungen unterschiedliche Tool-Aufrufe, unterschiedliche Datenzugriffsmuster und unterschiedliche Ausgaben erzeugen. Die „Angriffsfläche“ ist kein fester Satz von Endpunkten. Sie ist jede Aktion, die der Agent ausführen könnte, und sie wächst mit jedem Werkzeug und jeder Berechtigung, die Sie ihm geben.

Das ist nicht theoretisch. Im Juni 2025 ermöglichte eine Zero-Click-Prompt-Injection in Microsoft 365 Copilot (CVE-2025-32711, CVSS 9.3) Datenexfiltration ohne jegliche Benutzerinteraktion. Der Agent verarbeitete eine bösartige E-Mail, folgte versteckten Anweisungen und sendete sensible Daten an einen externen Endpunkt. Im Jahr 2026 löste eine versteckte Prompt-Injection in GitHub-Copilot-Pull-Request-Beschreibungen (CVE-2025-53773, CVSS 9.6) Remote Code Execution aus. Beide waren Agenten, die taten, wofür sie entwickelt wurden: Anweisungen befolgen — nur kamen die Anweisungen von einem Angreifer.

88 % der Organisationen, die KI-Agenten einsetzen, meldeten im vergangenen Jahr einen bestätigten oder vermuteten Sicherheitsvorfall. Nur 6 % der Sicherheitsbudgets sind der Sicherheit von KI-Agenten gewidmet. 97 % der kompromittierten Organisationen verfügten nicht über angemessene KI-Zugriffskontrollen. Forrester prognostiziert, dass eine agentenbasierte KI-Einführung im Jahr 2026 zu einer öffentlich bekannt gewordenen Sicherheitsverletzung führen wird, wobei die Hauptursache Governance-Fehler und nicht hochentwickelte Angreifer sind.

Die OWASP-Agenten-Top 10 und was jeder Punkt für Ihr Audit bedeutet

Die OWASP Top 10 für agentenbasierte Anwendungen ist nach Agentenfähigkeiten und nicht nach klassischen Schwachstellenklassen strukturiert. Die fünf Kategorien, die für ein Pre-Audit am wichtigsten sind:

Agent Goal Hijack (ASI-01). Ein Angreifer lenkt das Ziel des Agenten durch Prompt-Injection oder manipulierten Kontext um. Der Zero-Click-Angriff auf Microsoft Copilot ist das Lehrbuchbeispiel. Audit-Prüfung: Kann externer Inhalt, etwa E-Mails, Dokumente oder vom Agenten abgerufene Webseiten, die Ziele des Agenten verändern? Gibt es eine Eingabevalidierung zwischen abgerufenem Kontext und dem Instruktionssatz des Agenten?

Rogue Agents (ASI-02). Ein Agent überschreitet seinen vorgesehenen Umfang durch Zielabweichung oder Ausnutzung. Der RCE-Angriff auf GitHub Copilot zeigte, wie ein Agent über seine normalen Eingabekanäle als Waffe missbraucht werden kann. Audit-Prüfung: Hat jeder Agent einen definierten Scope mit Laufzeitdurchsetzung? Gibt es einen Kill Switch?

Tool Misuse (ASI-03). Ein Agent verwendet seine Werkzeuge auf unbeabsichtigte Weise, weil die Berechtigungen zu weit gefasst waren. Die OpenClaw-Krise legte mehr als 21.000 Agenteninstanzen offen, weil die Werkzeugberechtigungen nicht auf den minimal erforderlichen Zugriff beschränkt waren. Audit-Prüfung: Hat jedes Werkzeug explizite Eingabevalidierung und nur die unbedingt erforderlichen Berechtigungen?

Delegated Trust Exploitation (ASI-04). In Multi-Agenten-Systemen delegiert ein Agent an einen anderen und erzeugt damit Vertrauenskette. Der Drift/Salesforce-Supply-Chain-Angriff zeigte, wie gestohlene OAuth-Tokens aus einer Integration sich über mehr als 700 Kundenumgebungen verbreiteten. Audit-Prüfung: Verifiziert jeder Agent die Ausgaben anderer Agenten? Werden Vertrauensgrenzen an jedem Delegationspunkt durchgesetzt?

Supply-Chain-Schwachstellen (ASI-05). Drittanbieter-Tools, Plugins und Marketplace-Agenten bringen Risiken ein, die die einsetzende Organisation nicht kontrolliert. Audit-Prüfung: Gibt es eine geprüfte Liste freigegebener Tools und Plugins? Werden Ausgaben von Drittanbieter-Agenten als nicht vertrauenswürdige Eingaben behandelt?

Die 8-Punkte-Checkliste vor dem Audit

Die Frameworks von OWASP, NIST, dem MAESTRO-Framework der Cloud Security Alliance und dem AEGIS-Framework von Forrester laufen auf dieselben Kontrollen hinaus. Gehen Sie diese acht Prüfungen vor Ihrem nächsten Review durch.

1. Identität und Zugriff des Agenten

Jeder Agent erhält eine eindeutige Identität, keine geteilten Zugangsdaten. Jeder Tool-Aufruf wird authentifiziert. Prinzip des geringsten Privilegs pro Agent, nicht pro Deployment. Nur 22 % der Unternehmen behandeln Agenten heute als eigenständige Identitäten. Die übrigen 78 % verwenden geteilte Zugangsdaten, was bedeutet: Wird ein Agent kompromittiert, ist alles mit demselben Credential kompromittiert.

2. Scope-Grenzen mit Laufzeitdurchsetzung

Jeder Agent hat eine dokumentierte Liste zulässiger Aktionen. Laufzeitdurchsetzung, nicht nur Richtliniendokumentation, verhindert Verhalten außerhalb des definierten Umfangs. Wenn ein Agent dafür entwickelt wurde, Dokumente zusammenzufassen, sollte er nicht in der Lage sein, E-Mails zu senden, auf Datenbanken zuzugreifen oder APIs außerhalb seines Mandats aufzurufen.

3. Eingabevalidierung gegen Prompt-Injection

Alle externen Eingaben, einschließlich Benutzernachrichten, abgerufener Dokumente und API-Antworten, werden validiert, bevor der Agent sie verarbeitet. Das ist die Kontrolle, die den Zero-Click-Angriff auf Microsoft Copilot hätte abfangen können. Prompt-Injection bleibt aus gutem Grund OWASPs Risiko Nummer 1 für LLMs.

4. Ausgabekontrollen und Datenfilter

Agentenausgaben werden vor dem Erreichen von Benutzern oder externen Systemen gegen Richtlinien geprüft. PII- und Filter für sensible Daten sind aktiv. Ausgabevalidierung erkennt sowohl Datenlecks als auch halluzinierte Inhalte, die in Multi-Agenten-Workflows nachgelagerte Aktionen auslösen könnten.

5. Unveränderlicher Audit-Trail

Jede Agentenaktion, jeder Tool-Aufruf und jede Entscheidung wird mit unveränderlichen Zeitstempeln protokolliert. Die Protokolle enthalten die Argumentationskette, nicht nur die Endausgabe. Wenn ein SOC-2-Auditor fragt: „Was hat dieser Agent getan und warum?“, brauchen Sie eine vollständige Antwort. Traditionelle API-Call-Logs reichen für Systeme, die schlussfolgern, nicht aus.

6. Auslöser für menschliche Aufsicht

Hochriskante Aktionen erfordern eine menschliche Freigabe. Eskalationspfade sind definiert und getestet. Die Schwellenwerte dafür, was als hochriskant gilt, sind dokumentiert und konfigurierbar, nicht fest in einen Systemprompt codiert, den nach dem Deployment niemand mehr prüft.

7. Tool-Governance

Jedes Werkzeug verfügt über dokumentierte Berechtigungen, Eingabeschemata und Ausgabeschemata. Kein Wildcard-Tool-Zugriff. 90 % der Agenten sind überberechtigt und verfügen über zehnmal mehr Privilegien, als ihre Aufgabe erfordert. Das Audit sollte jedes Werkzeug sichtbar machen, das ein Agent aufrufen kann, und für jedes einzelne prüfen, ob es gerechtfertigt ist.

8. Vertrauensgrenzen zwischen mehreren Agenten

Die Kommunikation zwischen Agenten validiert die Quellidentität. Ausgabeverifizierung an jedem Delegationspunkt. Keine impliziten Vertrauenskettend. Wenn Agent A an Agent B delegiert, verifiziert Agent A B's Ausgabe, bevor er darauf reagiert. Der Drift/Salesforce-Vorfall zeigte, was passiert, wenn Vertrauen unkontrolliert weitergegeben wird.

Der Compliance-Zeitplan beschleunigt sich

Die Hochrisikoverpflichtungen des EU AI Act treten am 2. August 2026 in Kraft. Der Colorado AI Act wird im Juni 2026 durchsetzbar. SOC-2-Auditoren beziehen KI-Agenten-Kontrollen bereits in ihre Prüfungen ein. SOC-2-Compliance für KI-Agenten-Infrastruktur kostet 35.000 $ bis 250.000 $+ im ersten Jahr und dauert 6 bis 18 Monate bis zur Type-II-Zertifizierung. Dieser Zeitplan bedeutet, dass Organisationen, die heute Agenten einsetzen, die Compliance-Arbeit jetzt beginnen müssen, nicht erst nach Eingang der ersten Audit-Anfrage.

Gartner prognostiziert, dass die Ausgaben für KI-Governance im Jahr 2026 492 Millionen US-Dollar erreichen und bis 2030 die Marke von 1 Milliarde US-Dollar überschreiten werden. Aktuell geben Unternehmen jedoch 17-mal mehr für KI-gestützte Security-Tools aus als für die Absicherung der KI selbst. Genau in diesem Ungleichgewicht entstehen Sicherheitsverletzungen.

Die Plattform von Beam AI umfasst integriertes RBAC, auf OAuth beschränkten Tool-Zugriff und unveränderliche Audit-Trails für jede Agentenaktion. Diese Kontrollen sind bei jedem Deployment dabei und nicht erst als Compliance-Ergänzung verfügbar, nachdem das Security-Team Bedenken geäußert hat.

Das Audit kommt. Bereiten Sie sich jetzt darauf vor.

OWASP, NIST, CSA, Forrester und Microsoft haben innerhalb von sechs Monaten voneinander AI-Agent-Sicherheitsframeworks veröffentlicht. Diese Konvergenz bedeutet, dass sich die Basiserwartungen für Enterprise-Sicherheitsreviews schnell verschieben. Die acht Kontrollen oben sind das Minimum, nicht die Obergrenze, aber sie decken die Angriffsvektoren ab, die in den eigenen Produkten von Microsoft und GitHub Schwachstellen mit CVSS 9.3 und 9.6 verursacht haben.

Organisationen, die heute Audit-Bereitschaft in ihre Agenten-Deployments integrieren, vermeiden das hektische Nachrüsten, das vor einem Jahrzehnt die Cloud-Adoption geprägt hat. Wer wartet, wird Kontrollen unter Termindruck, zu höheren Kosten und mit geringerer Abdeckung nachrüsten. Die Frameworks existieren. Die Vorfälle sind dokumentiert. Die Checkliste steht oben. Die einzige Variable ist, wann Sie anfangen.

Heute starten

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Nutzen Sie jetzt unsere Plattform und beginnen Sie mit der Entwicklung von KI-Agenten für verschiedene Arten von Automatisierungen

Heute starten

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Nutzen Sie jetzt unsere Plattform und beginnen Sie mit der Entwicklung von KI-Agenten für verschiedene Arten von Automatisierungen

Lösungen

Unsere Kunden

Plattform

Ressourcen

Über uns

Wie Sie Ihre KI-Agenten vor einer unternehmensweiten Sicherheitsprüfung auditieren

von

Fredrik Falk

Warum Agenten-Audits sich von Anwendungs-Audits unterscheiden

Die OWASP-Agenten-Top 10 und was jeder Punkt für Ihr Audit bedeutet

Die 8-Punkte-Checkliste vor dem Audit

1. Identität und Zugriff des Agenten

2. Scope-Grenzen mit Laufzeitdurchsetzung

3. Eingabevalidierung gegen Prompt-Injection

4. Ausgabekontrollen und Datenfilter

5. Unveränderlicher Audit-Trail

6. Auslöser für menschliche Aufsicht

7. Tool-Governance

8. Vertrauensgrenzen zwischen mehreren Agenten

Der Compliance-Zeitplan beschleunigt sich

Das Audit kommt. Bereiten Sie sich jetzt darauf vor.

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Starten Sie mit KI-Agenten zur Automatisierung von Prozessen

Neueste Artikel

NVIDIA Computex 2026: What the AI Agent Announcements Mean for Enterprise

8 Finance Workflows That Should Be AI Agents by Now (And One That Shouldn't)

What It Takes to Build Self-Learning Agents

NVIDIA Computex 2026: What the AI Agent Announcements Mean for Enterprise

8 Finance Workflows That Should Be AI Agents by Now (And One That Shouldn't)

What It Takes to Build Self-Learning Agents

The Best Claude Prompts for Financial Controllers Who Actually Use ERP Systems