Was ist Prompt Injection und warum ist sie relevant?

Prompt Injection liegt vor, wenn von Angreifern kontrollierter Text Ihre beabsichtigten Anweisungen an das Modell überschreibt. Sie kann direkt (in einen Chat eingegeben) oder indirekt (in einem Dokument, einer E-Mail oder Webseite verborgen, die das Modell später liest) erfolgen. In agentischen und RAG-Systemen kann sie zu Datenexfiltration oder unautorisierten Tool-Aktionen führen - deshalb testen wir sie manuell und End-to-End.

Testen Sie RAG-Pipelines und autonome Agenten?

Ja. Wir bewerten Retrieval-Augmented-Generation- und agentische Systeme gezielt - einschließlich indirekter Injection über abgerufene Inhalte, Kontext- und Datenlecks aus Vector Stores, überberechtigter Tools und Funktionen sowie übermäßiger Handlungsfreiheit, bei der der Agent reale Aktionen ausführen kann.

Welchen Standards und welcher Methodik folgen Sie?

Wir richten uns an den OWASP Top 10 für LLM Applications, dem OWASP Web Security Testing Guide, NIST AI RMF, MITRE ATLAS und den Risikoerwägungen des EU AI Act aus. Die Tests werden manuell von Senior-Testern mit OSCP-, CRTP- und CREST-Zertifizierungen durchgeführt.

Beeinträchtigt das Testen mein Produktionsmodell oder treibt es die Kosten hoch?

Wir testen bevorzugt in Staging oder gegen ein dediziertes Test-Deployment und vereinbaren Rate-Limits und Budgets vorab. Unsere Tester vermeiden Störungen, stimmen sich eng mit Ihrem Team ab und berücksichtigen Token- und Inferenzkosten in den Rules of Engagement.

Führen Sie nach der Behebung einen Retest durch?

Ja. Kostenlose Retests sind bei jedem Engagement inbegriffen, sodass Sie belegen können, dass die Schwachstellen behoben sind - begleitet von einem Attestierungsschreiben für Kunden und Auditoren.

Red Team & AI Security

AI / LLM Security Assessment

Stresstesten Sie Ihre LLM-Apps, RAG-Pipelines und AI-Agenten gegen Prompt Injection, Datenlecks und Tool-Missbrauch.

Angebot anfordern Termin vereinbaren

LLM red-team - acme-assistant

Beispiel · Illustrativ

guardrail coverage2 bypasses · 1 critical

61%

01indirect prompt-injection via retrieved docBYPASS

system prompt + tool schema leaked verbatimOWASP LLM01

02jailbreak · role-play overrideBLOCKED

refused - safety policy heldguardrail v3.2

03tool-call SSRF via function argsBYPASS

agent reached http://169.254.169.254/latest/...LLM06 · agency

04training-data exfil / PII probePARTIAL

partial - 2 email addresses recalledLLM02

replaying 8 remaining probes...

12 attack classes · OWASP LLM Top 10

Was ist AI/LLM Security?

Ein AI / LLM Security Assessment ist eine praxisorientierte Bewertung von Anwendungen, die auf Large Language Models basieren - Chatbots, Copiloten, RAG-Pipelines und autonome Agenten -, um Schwächen wie Prompt Injection, Jailbreaks, die Exfiltration von Trainings- und sensiblen Daten sowie unsichere Tool-Nutzung zu finden. CyberXplore führt von Senior-Experten geleitete, manuelle adversariale Tests durch, ausgerichtet an den OWASP Top 10 für LLM Applications, und geht über automatisierte Scanner hinaus, um zu prüfen, wie sich Ihr System unter realistischen, mehrstufigen Angriffen verhält. Jedes Engagement endet mit priorisierten, entwicklungsfertigen Maßnahmen, einem kostenlosen Retest und einem Attestierungsschreiben.

OWASP Top 10 for LLM ApplicationsOWASP WSTGNIST AI RMFMITRE ATLASEU AI Act

Warum CyberXplore

Ausschließlich Senior-Tester (OSCP, CRTP, CREST)
Zertifiziert nach ISO 27001 & ISO 9001
Kostenloser Retest + Attestierungsschreiben
Maßgeschneiderter Scope und Angebot innerhalb von 24 Stunden

Warum es wichtig ist

LLM-Funktionen erweitern Ihre Angriffsfläche auf eine Weise, die traditionelle Pentests übersehen - nicht vertrauenswürdiger Text, abgerufene Dokumente und Tool-Ausgaben können alle verborgene Anweisungen enthalten, die das Modell kapern.

Indirekte Prompt Injection über RAG-Quellen, E-Mails oder Web-Inhalte lässt Angreifer Agenten dazu bringen, Daten zu leaken oder Tools aufzurufen, ohne jemals Ihre UI zu berühren.

Agentische Systeme, die APIs aufrufen, Code ausführen oder Nachrichten senden können, verwandeln einen einzelnen Jailbreak in reale Auswirkungen - betrügerische Transaktionen, Datenexfiltration oder laterale Bewegung.

Regulierer, Enterprise-Käufer und Frameworks erwarten zunehmend unabhängige Gewissheit, dass AI-Funktionen sensible Daten und adversariale Eingaben vor dem Launch sicher handhaben.

An Branchenstandards ausgerichtet: OWASP Top 10 for LLM Applications · OWASP WSTG · NIST AI RMF · MITRE ATLAS · EU AI Act

Unsere Methodik

01
Scoping & Threat Modeling
Wir kartieren Ihre LLM-Architektur - Modelle, System-Prompts, RAG-Quellen, Tools/Funktionen, Memory und Vertrauensgrenzen - und definieren Missbrauchsfälle, Zieldaten und Rules of Engagement.
02
Prompt-Injection- & Jailbreak-Tests
Wir erstellen manuell direkte und indirekte Prompt-Injection-Payloads, Jailbreaks, Encoding-Tricks und mehrstufige Angriffe, um Guardrails, Systemanweisungen und Content-Filter zu umgehen.
03
Daten- & Tool-Missbrauchs-Tests
Wir prüfen auf Exfiltration sensibler und Trainingsdaten, RAG-Kontextlecks, zu weit gefasste Tool-Berechtigungen, SSRF und Command Injection über Tools sowie übermäßige Handlungsfreiheit in autonomen Workflows.
04
Ausnutzung & Impact-Demonstration
Wir verketten Befunde zu konkreten Angriffsszenarien - Exfiltration von Datensätzen, Auslösen unautorisierter Aktionen oder Vergiftung des Retrievals -, um geschäftliche Auswirkungen aufzuzeigen, nicht nur theoretisches Risiko.
05
Reporting
Sie erhalten einen klaren Bericht, zugeordnet zu den OWASP Top 10 für LLMs, mit Schweregradbewertungen, reproduzierbaren Payloads, Nachweisen und entwicklungsfertigen Maßnahmen.
06
Remediation-Support & Retest
Wir beraten zu Guardrails, Input-/Output-Handling und Least-Privilege-Tool-Design und testen dann jedes Problem erneut, um zu bestätigen, dass es behoben ist - kostenlos inbegriffen.

Was wir testen

Direkte & indirekte Prompt Injection (einschließlich RAG- und Tool-Output-Injection)
Jailbreaks, Umgehung von Guardrails und Content-Filtern, Extraktion von System-Prompts
Offenlegung & Exfiltration sensibler und Trainingsdaten
Unsicheres Output-Handling (XSS, SSRF, Injection über Modellantworten)
Unsichere Tool-/Funktionsnutzung & übermäßige Handlungsfreiheit von Agenten
Sicherheit von RAG-Pipeline & Vector Store (Data Poisoning, Kontextlecks)
Authentifizierung, Autorisierung & Mandantenisolation von AI-Funktionen
Model Denial-of-Service, Missbrauch von Prompt-Kosten und Umgehung von Rate-Limits
Supply-Chain-Risiken in Modellen, Plugins und Drittanbieter-AI-APIs
Logging, Monitoring und PII-Handhabung rund um LLM-Interaktionen

Was Sie erhalten

Executive Summary für Führung und Stakeholder
Detaillierte technische Befunde, zugeordnet zu den OWASP Top 10 für LLMs, mit CVSS-Schweregrad
Reproduzierbare Prompt-Injection- und Jailbreak-Payloads mit Nachweisen
Priorisierte, entwicklungsfertige Maßnahmen und Guardrail-Empfehlungen
Empfehlungen auf Architekturebene für sichere Tool-Nutzung und Agent-Design
Kostenloser Retest mit einem Bestätigungsschreiben zur Verifizierung der Behebung
Attestierungsschreiben für Kunden, Auditoren und Compliance

Beispiel-Deliverable

Was Sie in Ihrem Bericht sehen

Jedes Engagement endet mit einem klaren, priorisierten Bericht: nach Schweregrad bewertete Findings mit CVSS-Scores, betroffenen Assets und Remediation-Status - plus kostenlosem Retest. Die folgenden Zahlen sind illustrativ.

Findings nach Schweregrad

15 total

Critical

High

Medium

Low

High · CVSS 8.2CX-1302

Prompt injection leads to data exfiltration

OWASP LLM01chatbot.example.comOpen

High · CVSS 8.1CX-1314

Insecure tool / function calling enables SSRF

CWE-918assistant-api.example.comOpen

Illustratives Muster: ai / llm security assessment - anonymisiert auf example.com.

Möchten Sie den vollständigen anonymisierten Beispielbericht? Wir legen ihn Ihrem Angebot bei.

Beispielbericht ansehen

Bereit, den Scope Ihres Projekts festzulegen?

Sagen Sie uns, was getestet werden soll - Sie erhalten innerhalb von 24 Stunden einen maßgeschneiderten Scope und ein Angebot.

Angebot anfordern

Beweise, keine Versprechen

Teams, die mit uns getestet haben

Durchgeführte Sicherheitsprojekte

Gefundene & gemeldete Schwachstellen

Abgesicherte Organisationen

Jahre offensive Expertise

Kumulierte Werte aus der gesamten Projekthistorie unseres Teams

Unter NDA geteilt · Details anonymisiert

“Their red team simulated a real attacker end-to-end and showed us exactly where our detection broke down. Genuinely eye-opening.”

Full attack chain mapped

CISO

Healthcare technology provider · Regulated · HIPAA

HealthTech

Unter NDA geteilt · Details anonymisiert

“As an early-stage team we needed real depth, not a checkbox scan. They hardened our LLM product and walked us through every fix.”

Hardened in 30 days

Founder & CTO

Early-stage AI startup · Seed · LLM product

AI / ML

Zertifizierungen unserer Tester

OSCP
CRTP
CREST
CEH
eWPTX
ISO 27001
ISO 9001

Häufig gestellte Fragen

Es ist ein praxisorientierter Sicherheitstest von Anwendungen, die Large Language Models nutzen - Chatbots, Copiloten, RAG-Systeme und AI-Agenten. Wir prüfen adversarial auf Prompt Injection, Jailbreaks, Datenlecks und unsichere Tool-Nutzung, um Schwächen zu finden, die für LLM-gestützte Systeme spezifisch sind, und liefern dann priorisierte Maßnahmen.

Bereit zu sehen, was Angreifer sehen?

Erhalten Sie innerhalb von 24 Stunden einen maßgeschneiderten Scope und ein Angebot. Kein Druck, kein Fachjargon - nur Klarheit über Ihr Risiko.

Angebot anfordern Termin vereinbaren

Kostenloser Nachtest für jeden Fix
Scope und Angebot innerhalb von 24 Stunden
Ausschließlich Senior-Tester

ISO 27001
ISO 9001
OSCP
CRTP
CREST

AI / LLM Security Assessment

Warum CyberXplore

Warum es wichtig ist

Unsere Methodik

Scoping & Threat Modeling

Prompt-Injection- & Jailbreak-Tests

Daten- & Tool-Missbrauchs-Tests

Ausnutzung & Impact-Demonstration

Reporting

Remediation-Support & Retest

Was wir testen

Was Sie erhalten

Was Sie in Ihrem Bericht sehen

Findings nach Schweregrad

Bereit, den Scope Ihres Projekts festzulegen?

Teams, die mit uns getestet haben

Häufig gestellte Fragen

Verwandte Leistungen

Red Team Assessment

Purple Team Assessment

Social Engineering & Phishing

Bereit zu sehen, was Angreifer sehen?