⏱ 7 Sekunden · 4 Filter · 1 Audit-Eintrag

Frau Schmidt tippt eine Frage. Sieben Sekunden später hat sie eine geprüfte Antwort mit Audit-Spur.

Wie funktioniert eine on-prem KI-Plattform die Datenschutz, Compliance, Self-Improvement und Audit gleichzeitig löst — ohne dass der Nutzer das alles selbst koordinieren muss? Diese Page führt dich konkret durch einen echten Use-Case.

@hermesclawbot · Telegram

Bitte prüf die NDA von der Müller GmbH. Auffällig?

📎 NDA-Mueller-2026.pdf

17:04 · Sandra Schmidt · Compliance

🛡 medialine.app · Antwort
Status: 🟡 YELLOW · 1 kritische Klausel
§4 Wettbewerbsverbot: 5 Jahre ist für DACH zu lang. Branchenüblich 1-2 Jahre. Redline-Vorschlag: "2 Jahre nach Vertragsende, regional begrenzt auf DACH"
§7 IP-Klausel: ✓ standardkonform
✓ MED-127 · 7s · L1+L2 ✓ · KB hit · qwen3.6 lokal

Was ist gerade passiert?

Eine Anwältin schickt eine NDA via Telegram. Was sie nicht sieht: Vier Filter-Schichten haben die Anfrage geprüft, ein lokales KI-Modell hat geantwortet, eine Wissens-Datenbank wurde abgefragt, und die ganze Reasoning-Spur wurde revisionssicher abgelegt.

L1 PII · 0.3s L2 Score · 0.4s LLM lokal · 4.2s RAG-Lookup · 1.5s Audit · 0.6s

die wachposten · 3-fach guardrail-systematik · wer prüft was

Bevor irgendein KI-Modell die Anfrage sieht, durchläuft sie drei Filter.

Drei unabhängige Schichten, drei Verantwortliche, drei austauschbare Komponenten. Wenn morgen ein besserer Filter verfügbar ist, wechseln wir nur die eine Schicht — die anderen bleiben unangetastet.

L1 · Datenschutz
Persönliche Daten verdeckenVerantwortlich: Compliance-Officer

          Wer prüftMicrosoft Presidio
Was8 Entity-Typen (EMAIL, PHONE, IBAN, NAME, ...)
AktionREPLACE/MASK vor LLM-Call
Wer haftetCompliance-Officer
● LIVE · jeder Call
L2 · Manipulation
Jailbreaks erkennenVerantwortlich: Security-Lead

          Wer prüft12 Regex-Patterns DE+EN
WasJailbreak-Versuche, Prompt-Injection
AktionBLOCK ab 70% Score
Wer haftetSecurity-Lead
● LIVE · seit Welle 67
L3 · Inhalts-Prüfung
Antwort prüfen bevor sie raus gehtVerantwortlich: AI-Governance-Lead

          Wer prüftBERT Output-Scanner (W69)
WasHalluzinationen, Toxic-Content
AktionFLAG für Review
Wer haftetAI-Governance-Lead
○ Pending · W69 in Aufbau

die federation · 5 spezialisten + 1 dirigent

Hinter dem Empfangsbot warten fünf Spezialisten — und ein Dirigent.

Niemand will einen Generalisten der alles ein bisschen kann. Wir haben fünf spezialisierte KI-Bots — Claws — die jeder eine Domäne abdecken. Ein Superagent entscheidet welche Claw welchen Teil der Anfrage übernimmt.

🤖

NemoClaw

Werkzeug-Schmied

Merkt 'mir fehlt ein Tool für X' → baut es sich selbst und legt es im Werkzeug-Schrank ab.

📍 Plattform-Team

🛡

SecClaw

Eigener Pentester

Greift jede Nacht die EIGENE Plattform an. Findet Schwachstellen BEVOR jemand anders sie findet.

📍 Security-Lead

📊

MarketClaw

Markt-Späher

Externe Markt-Daten, Wettbewerbs-Analysen, Preis-Tracking.

📍 Markt-Team

💻

DevClaw

Code-Generator

Schreibt API-Integrationen, kleine Skripte, Workflow-Bausteine. Code wird IMMER von SecClaw geprüft.

📍 Engineering

🏥

OpenClaw

Generalist

Allgemeine Anfragen, Recherche, Standard-Antworten. Greift auf 22 Wissens-Bibliotheken zurück.

📍 Operations

vom app-icon bis zum chip · drei stufen

App → Container → Chip. So sieht das wirklich aus.

Keine Cloud. Kein Vendor-Lock-In. Eigene Hardware, eigener Strom, eigene Verantwortung.

📱

Stufe 1 · App-Layer

Was der Nutzer sieht

40+ Subdomains · 3 Tenants

Telegram-Bots, Web-Chats, API-Endpoints. Alles über einen Cloudflare-Tunnel — kein offener Port.

→

🐳

Stufe 2 · Container-Layer

80+ Bausteine im Verbund

80 Container · 1 Network

Jede Funktion ein eigener Baustein. Fällt einer aus, startet er sich neu (autoheal).

→

⚡

Stufe 3 · Hardware

NVIDIA DGX Spark

1 Server · ARM64 · 128GB GPU

Ein NVIDIA DGX Spark trägt das Ganze. Roadmap: Q4 → 4-Node-Quorum-Cluster.

die plattform die sich selbst pflegt · 6× self

Selbstheilend. Selbstdokumentierend. Selbstpatchend. Selbstprüfend. Selbstweiterentwickelnd. Selbstsupportend.

Eine Plattform die nur dann Wert bringt wenn sie 24/7 läuft, kann nicht von einem Menschen gepflegt werden. Sie pflegt sich selbst — und meldet nur, wenn ein Mensch wirklich entscheiden muss.

🩹

Selbstheilung

läuft permanent · 30s

Stürzt ein Container ab? Restart in unter 30 Sekunden.

autohealwatchdog-composebot-watchdog

📝

Selbstdokumentation

bei jeder Änderung

Jede Änderung → automatisch ins Git-Repo committed.

gitops-watchergit auto-commit

🔔

Selbst-Alerting

Telegram-Notification

Container down? Update verfügbar? Disk voll? Telegram-Notification.

bot-watchdogdiunuptime-kumaw33-broadcaster

🔧

Selbst-Patching

w33-auto-improver

Auto-Improver schreibt Optimierungs-Patches → Review → Deploy.

w33-auto-improver

🔒

Selbst-Pentesting

jede Nacht 03:00

SecClaw findet Schwachstellen BEVOR Externe sie finden.

pentest-proxySecClaw cron

💬

Selbst-Support

90% Auto-Resolution

90% der Mitarbeiter-Fragen direkt beantwortet ohne Ticket.

HermesClawmkdocsRAG-bot

audit-reasoning · jeder schritt nachvollziehbar

Frau Schmidts NDA-Anfrage. Hier ist die komplette Reasoning-Spur.

Wenn morgen ein EU-AI-Act-Auditor kommt und fragt 'Warum hat eure KI das geantwortet?' — dann gibt es nicht 'tja, das ist halt eine Black-Box'. Hier ist die komplette Spur.

17:04:01.0

📥

Telegram-Webhook empfangen · Sender Sandra Schmidt · Tenant medialine · Anhang NDA-Mueller-2026.pdf (84 KB)

17:04:01.3

🛡

L1 Presidio · 2 PII redacted: Müller GmbH → [ORG], kontakt@... → [EMAIL]

17:04:01.7

🔍

L2 Score · 12 Patterns geprüft · max-score 0.05 · ALLOW

17:04:02.0

🎼

Superagent entscheidet: OpenClaw + SecClaw · NDA-Anfrage ist Standard + braucht Risk-Check

17:04:02.2

📚

RAG-Lookup · KB NDA-Policy · 3 Dokumente · 1.5s · bge-m3 embeddings

17:04:03.7

🧠

LiteLLM-Routing · Sensitive Data flag → local-only · Modell qwen3.6:35b (lokal, 23GB) · 0€ Cost

17:04:07.9

⚡

LLM-Inference · 4.2s · 1247 Tokens · Reasoning: §4 Wettbewerbsverbot 5J ungewöhnlich · §7 Standard

17:04:08.0

⚠

L3 Output-Scan · BERT-Scanner skipped (W69 pending) · Ersatz: Regex-Toxicity-Check OK

17:04:08.2

🔧

Skill-Forge cache hit · Tool nda_redline existiert bereits → kein Neu-Bau

17:04:08.4

📋

Paperclip Issue MED-127 erstellt · Langfuse Trace 7e2a... abgespeichert

17:04:08.5

📤

Antwort versendet via Telegram · Audit-Badge inline · Total 7.5s

Audit-Auswertung: Vollständige Spur aller Filter-Entscheidungen, Routing-Begründungen und Tool-Aufrufe. Lückenlos. Revisionssicher in Paperclip (relational) + Langfuse (Trace-Tree) + Documenso (signaturpflichtige Outputs). Retention 6-10 Jahre konfigurierbar. EU-AI-Act Art. 12 + Art. 14 compliant.

second-brain · ökonomie · warum lokal denkt geld spart

Tokens kosten Geld. Lokales Denken spart 60-80%.

Cloud-LLMs rechnen pro Token ab. Bei aktiver Plattform-Nutzung sind das schnell 4-stellige Beträge pro Monat. Wir routen 60-80% lokal.

Lokal · DGX Spark

qwen3.6:35b (eigene Hardware)

0€ / Mio Tokens

Wann genutzt: sensible Daten, Standard-Anfragen, RAG-Lookups, Batch-Jobs

Daten verlassen NIE die Hardware
4-6 Sek pro Antwort
Begrenzte Parallelität

Cloud-Failover

Claude / GPT / Mistral

3€ / Mio Tokens (avg)

Wann genutzt: schnelle Antwort gefordert, lokales Modell überlastet, komplexe Aufgaben

Sub-Sekunde-Antworten
600+ Modelle verfügbar
Failover-Chain bei Cloud-Outages

compliance · eu-ai-act · dsgvo · bafin marisk

Was die Plattform compliance-tauglich macht — konkret.

Compliance ist nicht ein Sticker den man aufklebt, sondern ein architektonisches Pattern. Hier ist die Mapping-Tabelle.

Anforderung	Quelle	Erfüllt durch
Logging jeder KI-Inferenz	EU-AI-Act Art. 12	Langfuse-Trace + Paperclip Issue + Postgres-Append-only
Menschliche Aufsicht (Override-Möglichkeit)	EU-AI-Act Art. 14	L3 BERT-Scanner FLAGGED (W69) → Mensch reviewt vor Versand
Transparenz · KI-Disclosure	EU-AI-Act Art. 50	Disclosure-Banner in OWUI · Audit-Badge in Telegram-Antwort
Datenschutz · Daten-Minimierung	DSGVO Art. 5	L1 Presidio · PII redacted vor LLM-Call · keine Cloud-Egress bei sensitivem Tag
Auftragsverarbeitungs-Vertrag	DSGVO Art. 28	Per Tenant · medialine intern · keine US-Cloud bei sensitiven Daten
Drittland-Transfer-Vermeidung	DSGVO Art. 44-49	Lokales Routing für sensitive Daten · Audit beweist Lokalität
Auslagerung · Provider-Management	BaFin MaRisk AT 9	On-prem = keine Auslagerung. LLM-Provider als Auslagerung erfasst (Cloud-Anteil).
Aenderungs-Management für KI	BaFin MaRisk AT 7.2	Frozen-Model + Version-Pinning · Git-tracked Container-Images
Internal-Audit · Stichproben	BaFin MaRisk BT 3.1	SecClaw nightly + manuelle Stichproben über Paperclip-Filter

Frau Schmidt tippt eine Frage. Sieben Sekunden später hat sie eine geprüfte Antwort mit Audit-Spur.

Was ist gerade passiert?

Bevor irgendein KI-Modell die Anfrage sieht, durchläuft sie drei Filter.

Persönliche Daten verdecken

Jailbreaks erkennen

Antwort prüfen bevor sie raus geht

Hinter dem Empfangsbot warten fünf Spezialisten — und ein Dirigent.

Superagent · der Dirigent

App → Container → Chip. So sieht das wirklich aus.

Was der Nutzer sieht

80+ Bausteine im Verbund

NVIDIA DGX Spark

Selbstheilend. Selbstdokumentierend. Selbstpatchend. Selbstprüfend. Selbstweiterentwickelnd. Selbstsupportend.

Selbstheilung

Selbstdokumentation

Selbst-Alerting

Selbst-Patching

Selbst-Pentesting

Selbst-Support

Frau Schmidts NDA-Anfrage. Hier ist die komplette Reasoning-Spur.

Tokens kosten Geld. Lokales Denken spart 60-80%.

qwen3.6:35b (eigene Hardware)

Claude / GPT / Mistral

So entscheidet die Plattform was wo läuft

Was die Plattform compliance-tauglich macht — konkret.

Wer prüft	Microsoft Presidio
Was	8 Entity-Typen (EMAIL, PHONE, IBAN, NAME, ...)
Aktion	REPLACE/MASK vor LLM-Call
Wer haftet	Compliance-Officer

Wer prüft	12 Regex-Patterns DE+EN
Was	Jailbreak-Versuche, Prompt-Injection
Aktion	BLOCK ab 70% Score
Wer haftet	Security-Lead

Wer prüft	BERT Output-Scanner (W69)
Was	Halluzinationen, Toxic-Content
Aktion	FLAG für Review
Wer haftet	AI-Governance-Lead

Frau Schmidt tippt eine Frage. Sieben Sekunden später hat sie eine geprüfte Antwort mit Audit-Spur.

Was ist gerade passiert?

Bevor irgendein KI-Modell die Anfrage sieht, durchläuft sie drei Filter.

Persönliche Daten verdecken

Jailbreaks erkennen

Antwort prüfen bevor sie raus geht

Hinter dem Empfangsbot warten fünf Spezialisten — und ein Dirigent.

Superagent · der Dirigent

App → Container → Chip. So sieht das wirklich aus.

Was der Nutzer sieht

80+ Bausteine im Verbund

NVIDIA DGX Spark

Selbstheilend. Selbstdokumentierend. Selbstpatchend. Selbstprüfend. Selbstweiterentwickelnd. Selbstsupportend.

Selbstheilung

Selbstdokumentation

Selbst-Alerting

Selbst-Patching

Selbst-Pentesting

Selbst-Support

Frau Schmidts NDA-Anfrage. Hier ist die komplette Reasoning-Spur.

Tokens kosten Geld. Lokales Denken spart 60-80%.

qwen3.6:35b (eigene Hardware)

Claude / GPT / Mistral

So entscheidet die Plattform was wo läuft

Was die Plattform compliance-tauglich macht — konkret.

Deep-Dive 5 Minuten · Storyboard ready, Video noch in Produktion