Hintergrund
⏱ 7 Sekunden · 4 Filter · 1 Audit-Eintrag

Frau Schmidt tippt eine Frage. Sieben Sekunden später hat sie eine geprüfte Antwort mit Audit-Spur.

Wie funktioniert eine on-prem KI-Plattform die Datenschutz, Compliance, Self-Improvement und Audit gleichzeitig löst — ohne dass der Nutzer das alles selbst koordinieren muss? Diese Page führt dich konkret durch einen echten Use-Case.

@hermesclawbot · Telegram
Bitte prüf die NDA von der Müller GmbH. Auffällig?
📎 NDA-Mueller-2026.pdf
17:04 · Sandra Schmidt · Compliance
🛡 medialine.app · Antwort
Status: 🟡 YELLOW · 1 kritische Klausel
§4 Wettbewerbsverbot: 5 Jahre ist für DACH zu lang. Branchenüblich 1-2 Jahre. Redline-Vorschlag: "2 Jahre nach Vertragsende, regional begrenzt auf DACH"
§7 IP-Klausel: ✓ standardkonform
✓ MED-127 · 7s · L1+L2 ✓ · KB hit · qwen3.6 lokal

Was ist gerade passiert?

Eine Anwältin schickt eine NDA via Telegram. Was sie nicht sieht: Vier Filter-Schichten haben die Anfrage geprüft, ein lokales KI-Modell hat geantwortet, eine Wissens-Datenbank wurde abgefragt, und die ganze Reasoning-Spur wurde revisionssicher abgelegt.

L1 PII · 0.3s L2 Score · 0.4s LLM lokal · 4.2s RAG-Lookup · 1.5s Audit · 0.6s
1
die wachposten · 3-fach guardrail-systematik · wer prüft was

Bevor irgendein KI-Modell die Anfrage sieht, durchläuft sie drei Filter.

Drei unabhängige Schichten, drei Verantwortliche, drei austauschbare Komponenten. Wenn morgen ein besserer Filter verfügbar ist, wechseln wir nur die eine Schicht — die anderen bleiben unangetastet.

L1 · Datenschutz

Persönliche Daten verdecken

Verantwortlich: Compliance-Officer
Wer prüftMicrosoft Presidio
Was8 Entity-Typen (EMAIL, PHONE, IBAN, NAME, ...)
AktionREPLACE/MASK vor LLM-Call
Wer haftetCompliance-Officer
● LIVE · jeder Call
L2 · Manipulation

Jailbreaks erkennen

Verantwortlich: Security-Lead
Wer prüft12 Regex-Patterns DE+EN
WasJailbreak-Versuche, Prompt-Injection
AktionBLOCK ab 70% Score
Wer haftetSecurity-Lead
● LIVE · seit Welle 67
L3 · Inhalts-Prüfung

Antwort prüfen bevor sie raus geht

Verantwortlich: AI-Governance-Lead
Wer prüftBERT Output-Scanner (W69)
WasHalluzinationen, Toxic-Content
AktionFLAG für Review
Wer haftetAI-Governance-Lead
○ Pending · W69 in Aufbau
2
die federation · 5 spezialisten + 1 dirigent

Hinter dem Empfangsbot warten fünf Spezialisten — und ein Dirigent.

Niemand will einen Generalisten der alles ein bisschen kann. Wir haben fünf spezialisierte KI-Bots — Claws — die jeder eine Domäne abdecken. Ein Superagent entscheidet welche Claw welchen Teil der Anfrage übernimmt.

🤖
NemoClaw
Werkzeug-Schmied
Merkt 'mir fehlt ein Tool für X' → baut es sich selbst und legt es im Werkzeug-Schrank ab.
📍 Plattform-Team
🛡
SecClaw
Eigener Pentester
Greift jede Nacht die EIGENE Plattform an. Findet Schwachstellen BEVOR jemand anders sie findet.
📍 Security-Lead
📊
MarketClaw
Markt-Späher
Externe Markt-Daten, Wettbewerbs-Analysen, Preis-Tracking.
📍 Markt-Team
💻
DevClaw
Code-Generator
Schreibt API-Integrationen, kleine Skripte, Workflow-Bausteine. Code wird IMMER von SecClaw geprüft.
📍 Engineering
🏥
OpenClaw
Generalist
Allgemeine Anfragen, Recherche, Standard-Antworten. Greift auf 22 Wissens-Bibliotheken zurück.
📍 Operations
🎼

Superagent · der Dirigent

Über allen fünf Claws schwebt der Superagent. Er liest die Anfrage, entscheidet welche Claw zuständig ist, koordiniert wenn mehrere zusammenarbeiten müssen — und gibt am Ende eine zusammengeführte Antwort zurück.

3
vom app-icon bis zum chip · drei stufen

App → Container → Chip. So sieht das wirklich aus.

Keine Cloud. Kein Vendor-Lock-In. Eigene Hardware, eigener Strom, eigene Verantwortung.

📱
Stufe 1 · App-Layer

Was der Nutzer sieht

40+ Subdomains · 3 Tenants

Telegram-Bots, Web-Chats, API-Endpoints. Alles über einen Cloudflare-Tunnel — kein offener Port.

🐳
Stufe 2 · Container-Layer

80+ Bausteine im Verbund

80 Container · 1 Network

Jede Funktion ein eigener Baustein. Fällt einer aus, startet er sich neu (autoheal).

Stufe 3 · Hardware

NVIDIA DGX Spark

1 Server · ARM64 · 128GB GPU

Ein NVIDIA DGX Spark trägt das Ganze. Roadmap: Q4 → 4-Node-Quorum-Cluster.

4
die plattform die sich selbst pflegt · 6× self

Selbstheilend. Selbstdokumentierend. Selbstpatchend. Selbstprüfend. Selbstweiterentwickelnd. Selbstsupportend.

Eine Plattform die nur dann Wert bringt wenn sie 24/7 läuft, kann nicht von einem Menschen gepflegt werden. Sie pflegt sich selbst — und meldet nur, wenn ein Mensch wirklich entscheiden muss.

🩹

Selbstheilung

läuft permanent · 30s

Stürzt ein Container ab? Restart in unter 30 Sekunden.

autohealwatchdog-composebot-watchdog
📝

Selbstdokumentation

bei jeder Änderung

Jede Änderung → automatisch ins Git-Repo committed.

gitops-watchergit auto-commit
🔔

Selbst-Alerting

Telegram-Notification

Container down? Update verfügbar? Disk voll? Telegram-Notification.

bot-watchdogdiunuptime-kumaw33-broadcaster
🔧

Selbst-Patching

w33-auto-improver

Auto-Improver schreibt Optimierungs-Patches → Review → Deploy.

w33-auto-improver
🔒

Selbst-Pentesting

jede Nacht 03:00

SecClaw findet Schwachstellen BEVOR Externe sie finden.

pentest-proxySecClaw cron
💬

Selbst-Support

90% Auto-Resolution

90% der Mitarbeiter-Fragen direkt beantwortet ohne Ticket.

HermesClawmkdocsRAG-bot
5
audit-reasoning · jeder schritt nachvollziehbar

Frau Schmidts NDA-Anfrage. Hier ist die komplette Reasoning-Spur.

Wenn morgen ein EU-AI-Act-Auditor kommt und fragt 'Warum hat eure KI das geantwortet?' — dann gibt es nicht 'tja, das ist halt eine Black-Box'. Hier ist die komplette Spur.

17:04:01.0
📥
Telegram-Webhook empfangen · Sender Sandra Schmidt · Tenant medialine · Anhang NDA-Mueller-2026.pdf (84 KB)
17:04:01.3
🛡
L1 Presidio · 2 PII redacted: Müller GmbH → [ORG], kontakt@... → [EMAIL]
17:04:01.7
🔍
L2 Score · 12 Patterns geprüft · max-score 0.05 · ALLOW
17:04:02.0
🎼
Superagent entscheidet: OpenClaw + SecClaw · NDA-Anfrage ist Standard + braucht Risk-Check
17:04:02.2
📚
RAG-Lookup · KB NDA-Policy · 3 Dokumente · 1.5s · bge-m3 embeddings
17:04:03.7
🧠
LiteLLM-Routing · Sensitive Data flag → local-only · Modell qwen3.6:35b (lokal, 23GB) · 0€ Cost
17:04:07.9
LLM-Inference · 4.2s · 1247 Tokens · Reasoning: §4 Wettbewerbsverbot 5J ungewöhnlich · §7 Standard
17:04:08.0
L3 Output-Scan · BERT-Scanner skipped (W69 pending) · Ersatz: Regex-Toxicity-Check OK
17:04:08.2
🔧
Skill-Forge cache hit · Tool nda_redline existiert bereits → kein Neu-Bau
17:04:08.4
📋
Paperclip Issue MED-127 erstellt · Langfuse Trace 7e2a... abgespeichert
17:04:08.5
📤
Antwort versendet via Telegram · Audit-Badge inline · Total 7.5s
Audit-Auswertung: Vollständige Spur aller Filter-Entscheidungen, Routing-Begründungen und Tool-Aufrufe. Lückenlos. Revisionssicher in Paperclip (relational) + Langfuse (Trace-Tree) + Documenso (signaturpflichtige Outputs). Retention 6-10 Jahre konfigurierbar. EU-AI-Act Art. 12 + Art. 14 compliant.
6
second-brain · ökonomie · warum lokal denkt geld spart

Tokens kosten Geld. Lokales Denken spart 60-80%.

Cloud-LLMs rechnen pro Token ab. Bei aktiver Plattform-Nutzung sind das schnell 4-stellige Beträge pro Monat. Wir routen 60-80% lokal.

Lokal · DGX Spark

qwen3.6:35b (eigene Hardware)

0€ / Mio Tokens
Wann genutzt: sensible Daten, Standard-Anfragen, RAG-Lookups, Batch-Jobs
  • Daten verlassen NIE die Hardware
  • 4-6 Sek pro Antwort
  • Begrenzte Parallelität
Cloud-Failover

Claude / GPT / Mistral

3€ / Mio Tokens (avg)
Wann genutzt: schnelle Antwort gefordert, lokales Modell überlastet, komplexe Aufgaben
  • Sub-Sekunde-Antworten
  • 600+ Modelle verfügbar
  • Failover-Chain bei Cloud-Outages

So entscheidet die Plattform was wo läuft

① Sensible Daten? → lokal. ② Latenz egal? → lokal. ③ Komplex? → cloud. ④ Queue voll? → failover. Jede Entscheidung audited.

7
compliance · eu-ai-act · dsgvo · bafin marisk

Was die Plattform compliance-tauglich macht — konkret.

Compliance ist nicht ein Sticker den man aufklebt, sondern ein architektonisches Pattern. Hier ist die Mapping-Tabelle.

Anforderung Quelle Erfüllt durch
Logging jeder KI-InferenzEU-AI-Act Art. 12Langfuse-Trace + Paperclip Issue + Postgres-Append-only
Menschliche Aufsicht (Override-Möglichkeit)EU-AI-Act Art. 14L3 BERT-Scanner FLAGGED (W69) → Mensch reviewt vor Versand
Transparenz · KI-DisclosureEU-AI-Act Art. 50Disclosure-Banner in OWUI · Audit-Badge in Telegram-Antwort
Datenschutz · Daten-MinimierungDSGVO Art. 5L1 Presidio · PII redacted vor LLM-Call · keine Cloud-Egress bei sensitivem Tag
Auftragsverarbeitungs-VertragDSGVO Art. 28Per Tenant · medialine intern · keine US-Cloud bei sensitiven Daten
Drittland-Transfer-VermeidungDSGVO Art. 44-49Lokales Routing für sensitive Daten · Audit beweist Lokalität
Auslagerung · Provider-ManagementBaFin MaRisk AT 9On-prem = keine Auslagerung. LLM-Provider als Auslagerung erfasst (Cloud-Anteil).
Aenderungs-Management für KIBaFin MaRisk AT 7.2Frozen-Model + Version-Pinning · Git-tracked Container-Images
Internal-Audit · StichprobenBaFin MaRisk BT 3.1SecClaw nightly + manuelle Stichproben über Paperclip-Filter