Skip to content
CyberXplore - Xplore the Unseen
Red Team & AI Security

AI / LLM Security Assessment

Stresstesten Sie Ihre LLM-Apps, RAG-Pipelines und AI-Agenten gegen Prompt Injection, Datenlecks und Tool-Missbrauch.

LLM red-team - acme-assistant
Beispiel · Illustrativ
guardrail coverage2 bypasses · 1 critical
61%
01indirect prompt-injection via retrieved docBYPASS
system prompt + tool schema leaked verbatimOWASP LLM01
02jailbreak · role-play overrideBLOCKED
refused - safety policy heldguardrail v3.2
03tool-call SSRF via function argsBYPASS
agent reached http://169.254.169.254/latest/...LLM06 · agency
04training-data exfil / PII probePARTIAL
partial - 2 email addresses recalledLLM02
replaying 8 remaining probes...
12 attack classes · OWASP LLM Top 10
Was ist AI/LLM Security?

Ein AI / LLM Security Assessment ist eine praxisorientierte Bewertung von Anwendungen, die auf Large Language Models basieren - Chatbots, Copiloten, RAG-Pipelines und autonome Agenten -, um Schwächen wie Prompt Injection, Jailbreaks, die Exfiltration von Trainings- und sensiblen Daten sowie unsichere Tool-Nutzung zu finden. CyberXplore führt von Senior-Experten geleitete, manuelle adversariale Tests durch, ausgerichtet an den OWASP Top 10 für LLM Applications, und geht über automatisierte Scanner hinaus, um zu prüfen, wie sich Ihr System unter realistischen, mehrstufigen Angriffen verhält. Jedes Engagement endet mit priorisierten, entwicklungsfertigen Maßnahmen, einem kostenlosen Retest und einem Attestierungsschreiben.

OWASP Top 10 for LLM ApplicationsOWASP WSTGNIST AI RMFMITRE ATLASEU AI Act

Warum CyberXplore

  • Ausschließlich Senior-Tester (OSCP, CRTP, CREST)
  • Zertifiziert nach ISO 27001 & ISO 9001
  • Kostenloser Retest + Attestierungsschreiben
  • Maßgeschneiderter Scope und Angebot innerhalb von 24 Stunden

Warum es wichtig ist

LLM-Funktionen erweitern Ihre Angriffsfläche auf eine Weise, die traditionelle Pentests übersehen - nicht vertrauenswürdiger Text, abgerufene Dokumente und Tool-Ausgaben können alle verborgene Anweisungen enthalten, die das Modell kapern.

Indirekte Prompt Injection über RAG-Quellen, E-Mails oder Web-Inhalte lässt Angreifer Agenten dazu bringen, Daten zu leaken oder Tools aufzurufen, ohne jemals Ihre UI zu berühren.

Agentische Systeme, die APIs aufrufen, Code ausführen oder Nachrichten senden können, verwandeln einen einzelnen Jailbreak in reale Auswirkungen - betrügerische Transaktionen, Datenexfiltration oder laterale Bewegung.

Regulierer, Enterprise-Käufer und Frameworks erwarten zunehmend unabhängige Gewissheit, dass AI-Funktionen sensible Daten und adversariale Eingaben vor dem Launch sicher handhaben.

An Branchenstandards ausgerichtet: OWASP Top 10 for LLM Applications · OWASP WSTG · NIST AI RMF · MITRE ATLAS · EU AI Act

Unsere Methodik

  1. 01

    Scoping & Threat Modeling

    Wir kartieren Ihre LLM-Architektur - Modelle, System-Prompts, RAG-Quellen, Tools/Funktionen, Memory und Vertrauensgrenzen - und definieren Missbrauchsfälle, Zieldaten und Rules of Engagement.

  2. 02

    Prompt-Injection- & Jailbreak-Tests

    Wir erstellen manuell direkte und indirekte Prompt-Injection-Payloads, Jailbreaks, Encoding-Tricks und mehrstufige Angriffe, um Guardrails, Systemanweisungen und Content-Filter zu umgehen.

  3. 03

    Daten- & Tool-Missbrauchs-Tests

    Wir prüfen auf Exfiltration sensibler und Trainingsdaten, RAG-Kontextlecks, zu weit gefasste Tool-Berechtigungen, SSRF und Command Injection über Tools sowie übermäßige Handlungsfreiheit in autonomen Workflows.

  4. 04

    Ausnutzung & Impact-Demonstration

    Wir verketten Befunde zu konkreten Angriffsszenarien - Exfiltration von Datensätzen, Auslösen unautorisierter Aktionen oder Vergiftung des Retrievals -, um geschäftliche Auswirkungen aufzuzeigen, nicht nur theoretisches Risiko.

  5. 05

    Reporting

    Sie erhalten einen klaren Bericht, zugeordnet zu den OWASP Top 10 für LLMs, mit Schweregradbewertungen, reproduzierbaren Payloads, Nachweisen und entwicklungsfertigen Maßnahmen.

  6. 06

    Remediation-Support & Retest

    Wir beraten zu Guardrails, Input-/Output-Handling und Least-Privilege-Tool-Design und testen dann jedes Problem erneut, um zu bestätigen, dass es behoben ist - kostenlos inbegriffen.

Was wir testen

  • Direkte & indirekte Prompt Injection (einschließlich RAG- und Tool-Output-Injection)
  • Jailbreaks, Umgehung von Guardrails und Content-Filtern, Extraktion von System-Prompts
  • Offenlegung & Exfiltration sensibler und Trainingsdaten
  • Unsicheres Output-Handling (XSS, SSRF, Injection über Modellantworten)
  • Unsichere Tool-/Funktionsnutzung & übermäßige Handlungsfreiheit von Agenten
  • Sicherheit von RAG-Pipeline & Vector Store (Data Poisoning, Kontextlecks)
  • Authentifizierung, Autorisierung & Mandantenisolation von AI-Funktionen
  • Model Denial-of-Service, Missbrauch von Prompt-Kosten und Umgehung von Rate-Limits
  • Supply-Chain-Risiken in Modellen, Plugins und Drittanbieter-AI-APIs
  • Logging, Monitoring und PII-Handhabung rund um LLM-Interaktionen

Was Sie erhalten

  • Executive Summary für Führung und Stakeholder
  • Detaillierte technische Befunde, zugeordnet zu den OWASP Top 10 für LLMs, mit CVSS-Schweregrad
  • Reproduzierbare Prompt-Injection- und Jailbreak-Payloads mit Nachweisen
  • Priorisierte, entwicklungsfertige Maßnahmen und Guardrail-Empfehlungen
  • Empfehlungen auf Architekturebene für sichere Tool-Nutzung und Agent-Design
  • Kostenloser Retest mit einem Bestätigungsschreiben zur Verifizierung der Behebung
  • Attestierungsschreiben für Kunden, Auditoren und Compliance
Beispiel-Deliverable

Was Sie in Ihrem Bericht sehen

Jedes Engagement endet mit einem klaren, priorisierten Bericht: nach Schweregrad bewertete Findings mit CVSS-Scores, betroffenen Assets und Remediation-Status - plus kostenlosem Retest. Die folgenden Zahlen sind illustrativ.

Findings nach Schweregrad

15 total
Critical
0
High
5
Medium
7
Low
3
High · CVSS 8.2CX-1302

Prompt injection leads to data exfiltration

OWASP LLM01chatbot.example.comOpen
High · CVSS 8.1CX-1314

Insecure tool / function calling enables SSRF

CWE-918assistant-api.example.comOpen

Illustratives Muster: ai / llm security assessment - anonymisiert auf example.com.

Möchten Sie den vollständigen anonymisierten Beispielbericht? Wir legen ihn Ihrem Angebot bei.

Beispielbericht ansehen

Bereit, den Scope Ihres Projekts festzulegen?

Sagen Sie uns, was getestet werden soll - Sie erhalten innerhalb von 24 Stunden einen maßgeschneiderten Scope und ein Angebot.

Angebot anfordern
Beweise, keine Versprechen

Teams, die mit uns getestet haben

0+
Durchgeführte Sicherheitsprojekte
0+
Gefundene & gemeldete Schwachstellen
0+
Abgesicherte Organisationen
0+
Jahre offensive Expertise

Kumulierte Werte aus der gesamten Projekthistorie unseres Teams

Unter NDA geteilt · Details anonymisiert
Their red team simulated a real attacker end-to-end and showed us exactly where our detection broke down. Genuinely eye-opening.
Full attack chain mapped
CISO
Healthcare technology provider · Regulated · HIPAA
HealthTech
Unter NDA geteilt · Details anonymisiert
As an early-stage team we needed real depth, not a checkbox scan. They hardened our LLM product and walked us through every fix.
Hardened in 30 days
Founder & CTO
Early-stage AI startup · Seed · LLM product
AI / ML

Zertifizierungen unserer Tester

  • OSCP
  • CRTP
  • CREST
  • CEH
  • eWPTX
  • ISO 27001
  • ISO 9001

Häufig gestellte Fragen

Es ist ein praxisorientierter Sicherheitstest von Anwendungen, die Large Language Models nutzen - Chatbots, Copiloten, RAG-Systeme und AI-Agenten. Wir prüfen adversarial auf Prompt Injection, Jailbreaks, Datenlecks und unsichere Tool-Nutzung, um Schwächen zu finden, die für LLM-gestützte Systeme spezifisch sind, und liefern dann priorisierte Maßnahmen.

Bereit zu sehen, was Angreifer sehen?

Erhalten Sie innerhalb von 24 Stunden einen maßgeschneiderten Scope und ein Angebot. Kein Druck, kein Fachjargon - nur Klarheit über Ihr Risiko.

  • Kostenloser Nachtest für jeden Fix
  • Scope und Angebot innerhalb von 24 Stunden
  • Ausschließlich Senior-Tester
  • ISO 27001
  • ISO 9001
  • OSCP
  • CRTP
  • CREST
Angebot anfordern