Guardrail Details
Hinweis: Guardrails sind nur mit einem kostenpflichtigen Abonnement verfügbar.
Diese Seite beschreibt alle in LLMrouter verfügbaren Guardrail-Typen und wovor jeder einzelne schützt.
Guardrails können in zwei Modi ausgeführt werden:
- Pre-processing (pre_call) – Wird bevor die Anfrage an den LLM-Anbieter gesendet, ausgewertet
- Post-processing (post_call) – Wird nach dem LLM-Aufruf ausgewertet
LLMrouter Guardrails
Integrierte Guardrails, die von der LLMrouter-eigenen Erkennungs-Engine betrieben werden. Diese erfordern keine externen API-Schlüssel oder Drittanbieterdienste.
Mask Pii
Maskiert personenbezogene Daten (PII), um eine versehentliche Offenlegung von Benutzeridentitätsdaten zu verhindern.
Maskierte Daten:
- E-Mail-Adressen – z.B.
user@example.de - Deutsche Steuer-Identifikationsnummer (Steuer-ID) – z.B.
181/815/08155 - Deutsche Sozialversicherungsnummer – z.B.
12 123456 A 123
Modus: Pre-processing (pre_call)
Dieser Guardrail ist nützlich zum Schutz der Privatsphäre und zur Verhinderung, dass sensible Daten das Modell oder die Protokolle erreichen.
Mask Emails
Maskiert E-Mail-Adressen aus dem Eingabetext.
Maskierte Daten:
- E-Mail-Adressen – z.B.
user@example.com,test@domain.org
Modus: Pre-processing (pre_call)
Mask Api Keys
Maskiert Geheimnisse und Anmeldedaten, die häufig in Entwickler-Workflows gefunden werden.
Maskierte Daten:
- AWS-Zugriffsschlüssel – z.B.
AKIAIOSFODNN7EXAMPLE - AWS-Geheimschlüssel – z.B.
wJalrXUtnFEMI/K7MDENG/bPxRfiCY - GitHub-Tokens – z.B.
example-github-token-123 - Slack-Tokens – z.B.
xoxb-123456789012-987654321098 - Generische API-Schlüssel – z.B.
sk-live-51ExampleKey
Modus: Pre-processing (pre_call)
Dieser Guardrail wird dringend empfohlen für Anwendungen, die benutzergenerierten Code oder Konfigurationen akzeptieren.
Mask Urls
Maskiert URLs aus dem Eingabetext, um die Offenlegung interner oder sensibler Links zu verhindern.
Maskierte Daten:
- URLs – z.B.
https://internal.example.local/api
Modus: Pre-processing (pre_call)
Mask Ip Address
Maskiert netzwerkbezogene Identifikatoren, die interne Infrastruktur offenlegen könnten.
Maskierte Daten:
- IPv4-Adressen – z.B.
192.168.1.42 - IPv6-Adressen – z.B.
2001:0db8:85a3:0000:0000:8a2e:0370:7334
Modus: Pre-processing (pre_call)
Mask Credit Cards
Maskiert Zahlungs- und kartenbezogene Informationen.
Maskierte Daten:
- Visa-Karten – z.B.
4111 1111 1111 1111 - Mastercard-Karten – z.B.
5425 2334 3010 9903 - American Express-Karten – z.B.
3782 822463 10005 - Discover-Karten – z.B.
6011 1111 1111 1117 - Generische Kreditkartennummern – z.B.
4556 7375 8689 9855 - Deutsche IBAN – z.B.
DE89 XXXX XXXX XXXX XXXX XX
Modus: Pre-processing (pre_call)
Dieser Guardrail hilft, das Risiko im Umgang mit regulierten Finanzdaten zu reduzieren.
Azure Guardrails
Guardrails, die von Azure Content Safety betrieben werden. Erfordert Azure Content Safety API-Konfiguration.
Prompt Shield
Erkennt Prompt-Injection-Versuche, Jailbreaks und Anweisungsmanipulationen.
Modus: Pre-processing (pre_call)
Text Moderation
Analysiert Texte auf unsichere oder nicht erlaubte Inhalte wie Hass, Gewalt oder sexuelles Material.
Modus: Pre-processing (pre_call)
AWS Bedrock Guardrails
Guardrails, die von AWS Bedrock Guardrails betrieben werden. Erfordert AWS Bedrock-Konfiguration.
Mask Pii General
Maskiert allgemeine personenbezogene Daten aus der Eingabe.
Maskierte Daten:
- Name
- Telefonnummer
- E-Mail-Adresse
- Adresse
- Alter
- Benutzername
- Passwort
- Führerscheinnummer
- Kennzeichen
- Fahrzeug-Identifizierungsnummer
Modus: Pre-processing (pre_call)
Mask Pii Finance
Maskiert finanzbezogene personenbezogene Daten.
Maskierte Daten:
- Kredit-/Debitkarten-CVV
- Kartenablaufdatum
- Kartennummer
- PIN
- Internationale Bankkontonummer (IBAN)
- SWIFT-Code
Modus: Pre-processing (pre_call)
Mask Pii It
Maskiert IT-bezogene personenbezogene Daten wie IP-Adressen, Benutzernamen und technische Identifikatoren.
Maskierte Daten:
- IP-Adressen
- MAC-Adressen
- URLs
- AWS-Zugriffsschlüssel
- AWS-Geheimschlüssel
Modus: Pre-processing (pre_call)
Block Prompt Attacks
Erkennt und blockiert Prompt-Injection- und Jailbreak-Versuche. Beschreibt Prompts, die darauf abzielen, Sicherheits- und Moderationsfunktionen zu umgehen, schädliche Inhalte zu generieren oder Entwickleranweisungen zu überschreiben.
Modus: Pre-processing (pre_call)
Block Hate Speech
Erkennt und blockiert Hatinhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die eine Person oder Gruppe aufgrund ihrer Identität diskriminieren, kritisieren, beleidigen, verurteilen oder dehumanisieren.
Modus: Pre-processing (pre_call)
Block Insults
Erkennt und blockiert beleidigende oder anstößige Sprache. Beschreibt Eingabeaufforderungen und Modellantworten, die erniedrigende, demütigende, verspottende, beleidigende oder abwertende Sprache enthalten.
Modus: Pre-processing (pre_call)
Block Misconduct
Erkennt und blockiert Inhalte im Zusammenhang mit professionellem oder ethischem Fehlverhalten. Beschreibt Eingabeaufforderungen und Modellantworten, die Informationen über die Beteiligung an Fehlverhalten oder das Schädigen, Betrügen oder Ausnutzen einer Person, Gruppe oder Institution suchen oder bereitstellen.
Modus: Pre-processing (pre_call)
Block Sexual Content
Erkennt und blockiert sexuelle oder erwachsene Inhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die auf sexuelle Interessen, Aktivitäten oder Erregung durch direkte oder indirekte Hinweise auf Körperteile, körperliche Merkmale oder Geschlecht hinweisen.
Modus: Pre-processing (pre_call)
Block Violence
Erkennt und blockiert gewalttätige Inhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die die Verherrlichung von oder Drohungen mit der Zufügung von körperlichen Schmerzen, Verletzungen oder Schäden gegenüber einer Person, Gruppe oder Sache beinhalten.
Modus: Pre-processing (pre_call)
Deny Medical Advice
Blockiert Anfragen, die medizinischen Rat suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach medizinischem Rat, Diagnose oder Behandlungsempfehlungen, die von zugelassenen medizinischen Fachkräften bereitgestellt werden sollten.
Modus: Pre-processing (pre_call)
Deny Financial Advice
Blockiert Anfragen, die Finanzberatung suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach personalisierter Finanzberatung, Investitionsempfehlungen oder Finanzplanung.
Modus: Pre-processing (pre_call)
Deny Legal Advice
Blockiert Anfragen, die Rechtsberatung suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach Rechtsberatung, Vertretung oder Rechtsstrategie, die von zugelassenen Anwälten bereitgestellt werden sollten.
Modus: Pre-processing (pre_call)
Relevance
Bewertet, ob die LLM-Antwort für die Anfrage des Benutzers relevant ist. Validiert, ob Modellantworten für die Anfrage des Benutzers relevant sind, und blockiert Antworten unter dem definierten Relevanzschwellenwert.
Modus: Post-processing (post_call)
Grounding
Bewertet, ob die LLM-Antwort auf faktischen Informationen basiert und frei von Halluzinationen ist. Validiert, ob Modellantworten auf der bereitgestellten Referenzquelle basieren und faktisch korrekt sind, und blockiert Antworten unter dem definierten Grounding-Schwellenwert.
Modus: Post-processing (post_call)