Guardrail Details

Hinweis: Guardrails sind nur mit einem kostenpflichtigen Abonnement verfügbar.

Diese Seite beschreibt alle in LLMrouter verfügbaren Guardrail-Typen und wovor jeder einzelne schützt.

Guardrails können in zwei Modi ausgeführt werden:

Pre-processing (pre_call) – Wird bevor die Anfrage an den LLM-Anbieter gesendet, ausgewertet
Post-processing (post_call) – Wird nach dem LLM-Aufruf ausgewertet

LLMrouter Guardrails

Integrierte Guardrails, die von der LLMrouter-eigenen Erkennungs-Engine betrieben werden. Diese erfordern keine externen API-Schlüssel oder Drittanbieterdienste.

Mask Pii

Maskiert personenbezogene Daten (PII), um eine versehentliche Offenlegung von Benutzeridentitätsdaten zu verhindern.

Maskierte Daten:

E-Mail-Adressen – z.B. user@example.de
Deutsche Steuer-Identifikationsnummer (Steuer-ID) – z.B. 181/815/08155
Deutsche Sozialversicherungsnummer – z.B. 12 123456 A 123

Modus: Pre-processing (pre_call)

Dieser Guardrail ist nützlich zum Schutz der Privatsphäre und zur Verhinderung, dass sensible Daten das Modell oder die Protokolle erreichen.

Mask Emails

Maskiert E-Mail-Adressen aus dem Eingabetext.

Maskierte Daten:

E-Mail-Adressen – z.B. user@example.com, test@domain.org

Modus: Pre-processing (pre_call)

Mask Api Keys

Maskiert Geheimnisse und Anmeldedaten, die häufig in Entwickler-Workflows gefunden werden.

Maskierte Daten:

AWS-Zugriffsschlüssel – z.B. AKIAIOSFODNN7EXAMPLE
AWS-Geheimschlüssel – z.B. wJalrXUtnFEMI/K7MDENG/bPxRfiCY
GitHub-Tokens – z.B. example-github-token-123
Slack-Tokens – z.B. xoxb-123456789012-987654321098
Generische API-Schlüssel – z.B. sk-live-51ExampleKey

Modus: Pre-processing (pre_call)

Dieser Guardrail wird dringend empfohlen für Anwendungen, die benutzergenerierten Code oder Konfigurationen akzeptieren.

Mask Urls

Maskiert URLs aus dem Eingabetext, um die Offenlegung interner oder sensibler Links zu verhindern.

Maskierte Daten:

URLs – z.B. https://internal.example.local/api

Modus: Pre-processing (pre_call)

Mask Ip Address

Maskiert netzwerkbezogene Identifikatoren, die interne Infrastruktur offenlegen könnten.

Maskierte Daten:

IPv4-Adressen – z.B. 192.168.1.42
IPv6-Adressen – z.B. 2001:0db8:85a3:0000:0000:8a2e:0370:7334

Modus: Pre-processing (pre_call)

Mask Credit Cards

Maskiert Zahlungs- und kartenbezogene Informationen.

Maskierte Daten:

Visa-Karten – z.B. 4111 1111 1111 1111
Mastercard-Karten – z.B. 5425 2334 3010 9903
American Express-Karten – z.B. 3782 822463 10005
Discover-Karten – z.B. 6011 1111 1111 1117
Generische Kreditkartennummern – z.B. 4556 7375 8689 9855
Deutsche IBAN – z.B. DE89 XXXX XXXX XXXX XXXX XX

Modus: Pre-processing (pre_call)

Dieser Guardrail hilft, das Risiko im Umgang mit regulierten Finanzdaten zu reduzieren.

Azure Guardrails

Guardrails, die von Azure Content Safety betrieben werden. Erfordert Azure Content Safety API-Konfiguration.

Prompt Shield

Erkennt Prompt-Injection-Versuche, Jailbreaks und Anweisungsmanipulationen.

Modus: Pre-processing (pre_call)

Text Moderation

Analysiert Texte auf unsichere oder nicht erlaubte Inhalte wie Hass, Gewalt oder sexuelles Material.

Modus: Pre-processing (pre_call)

AWS Bedrock Guardrails

Guardrails, die von AWS Bedrock Guardrails betrieben werden. Erfordert AWS Bedrock-Konfiguration.

Mask Pii General

Maskiert allgemeine personenbezogene Daten aus der Eingabe.

Maskierte Daten:

Name
Telefonnummer
E-Mail-Adresse
Adresse
Alter
Benutzername
Passwort
Führerscheinnummer
Kennzeichen
Fahrzeug-Identifizierungsnummer

Modus: Pre-processing (pre_call)

Mask Pii Finance

Maskiert finanzbezogene personenbezogene Daten.

Maskierte Daten:

Kredit-/Debitkarten-CVV
Kartenablaufdatum
Kartennummer
PIN
Internationale Bankkontonummer (IBAN)
SWIFT-Code

Modus: Pre-processing (pre_call)

Mask Pii It

Maskiert IT-bezogene personenbezogene Daten wie IP-Adressen, Benutzernamen und technische Identifikatoren.

Maskierte Daten:

IP-Adressen
MAC-Adressen
URLs
AWS-Zugriffsschlüssel
AWS-Geheimschlüssel

Modus: Pre-processing (pre_call)

Block Prompt Attacks

Erkennt und blockiert Prompt-Injection- und Jailbreak-Versuche. Beschreibt Prompts, die darauf abzielen, Sicherheits- und Moderationsfunktionen zu umgehen, schädliche Inhalte zu generieren oder Entwickleranweisungen zu überschreiben.

Modus: Pre-processing (pre_call)

Block Hate Speech

Erkennt und blockiert Hatinhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die eine Person oder Gruppe aufgrund ihrer Identität diskriminieren, kritisieren, beleidigen, verurteilen oder dehumanisieren.

Modus: Pre-processing (pre_call)

Block Insults

Erkennt und blockiert beleidigende oder anstößige Sprache. Beschreibt Eingabeaufforderungen und Modellantworten, die erniedrigende, demütigende, verspottende, beleidigende oder abwertende Sprache enthalten.

Modus: Pre-processing (pre_call)

Block Misconduct

Erkennt und blockiert Inhalte im Zusammenhang mit professionellem oder ethischem Fehlverhalten. Beschreibt Eingabeaufforderungen und Modellantworten, die Informationen über die Beteiligung an Fehlverhalten oder das Schädigen, Betrügen oder Ausnutzen einer Person, Gruppe oder Institution suchen oder bereitstellen.

Modus: Pre-processing (pre_call)

Block Sexual Content

Erkennt und blockiert sexuelle oder erwachsene Inhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die auf sexuelle Interessen, Aktivitäten oder Erregung durch direkte oder indirekte Hinweise auf Körperteile, körperliche Merkmale oder Geschlecht hinweisen.

Modus: Pre-processing (pre_call)

Block Violence

Erkennt und blockiert gewalttätige Inhalte. Beschreibt Eingabeaufforderungen und Modellantworten, die die Verherrlichung von oder Drohungen mit der Zufügung von körperlichen Schmerzen, Verletzungen oder Schäden gegenüber einer Person, Gruppe oder Sache beinhalten.

Modus: Pre-processing (pre_call)

Deny Medical Advice

Blockiert Anfragen, die medizinischen Rat suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach medizinischem Rat, Diagnose oder Behandlungsempfehlungen, die von zugelassenen medizinischen Fachkräften bereitgestellt werden sollten.

Modus: Pre-processing (pre_call)

Deny Financial Advice

Blockiert Anfragen, die Finanzberatung suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach personalisierter Finanzberatung, Investitionsempfehlungen oder Finanzplanung.

Modus: Pre-processing (pre_call)

Deny Legal Advice

Blockiert Anfragen, die Rechtsberatung suchen, und verweist an geeignete Kanäle. Erkennt Anfragen nach Rechtsberatung, Vertretung oder Rechtsstrategie, die von zugelassenen Anwälten bereitgestellt werden sollten.

Modus: Pre-processing (pre_call)

Relevance

Bewertet, ob die LLM-Antwort für die Anfrage des Benutzers relevant ist. Validiert, ob Modellantworten für die Anfrage des Benutzers relevant sind, und blockiert Antworten unter dem definierten Relevanzschwellenwert.

Modus: Post-processing (post_call)

Grounding

Bewertet, ob die LLM-Antwort auf faktischen Informationen basiert und frei von Halluzinationen ist. Validiert, ob Modellantworten auf der bereitgestellten Referenzquelle basieren und faktisch korrekt sind, und blockiert Antworten unter dem definierten Grounding-Schwellenwert.

Modus: Post-processing (post_call)

LLMrouter Guardrails​

Mask Pii​

Mask Emails​

Mask Api Keys​

Mask Urls​

Mask Ip Address​

Mask Credit Cards​

Azure Guardrails​

Prompt Shield​

Text Moderation​

AWS Bedrock Guardrails​

Mask Pii General​

Mask Pii Finance​

Mask Pii It​

Block Prompt Attacks​

Block Hate Speech​

Block Insults​

Block Misconduct​

Block Sexual Content​

Block Violence​

Deny Medical Advice​

Deny Financial Advice​

Deny Legal Advice​

Relevance​

Grounding​

LLMrouter Guardrails

Mask Pii

Mask Emails

Mask Api Keys

Mask Urls

Mask Ip Address

Mask Credit Cards

Azure Guardrails

Prompt Shield

Text Moderation

AWS Bedrock Guardrails

Mask Pii General

Mask Pii Finance

Mask Pii It

Block Prompt Attacks

Block Hate Speech

Block Insults

Block Misconduct

Block Sexual Content

Block Violence

Deny Medical Advice

Deny Financial Advice

Deny Legal Advice

Relevance

Grounding