arXiv-Fallstudie 2026: Medizinischer RAG-Chatbot gab 1.000 Chats frei

Medizinischer RAG-Chatbot legt 2026 sensible Backend-Daten offen

Eine am 1. Mai 2026 bei arXiv eingereichte Fallstudie untersucht einen anonymisierten, öffentlich erreichbaren medizinischen RAG-Chatbot. Die Autoren berichten, dass gewöhnliche Browser-Werkzeuge ausreichten, um sensible Konfigurations- und Gesprächsdaten einzusehen. Das Thema ist besonders kritisch, weil der Chatbot patientennah eingesetzt wurde und Gesundheitsfragen verarbeitete.

Browser-Inspektion reichte für Systemprompt und Konfiguration

Laut Abstract fanden die Prüfer über sichtbaren Client-Server-Verkehr unter anderem Systemprompt, Modell- und Embedding-Konfiguration, Retrieval-Parameter, Backend-Endpunkte, API-Schema, Dokument- und Chunk-Metadaten sowie Knowledge-Base-Inhalte. Das ist ein klassischer Architekturfehler: Informationen, die serverseitig bleiben müssen, tauchen im Browser auf.

1.000 aktuelle Gespräche waren ohne Login abrufbar

Der härteste Befund betrifft Datenschutz. Die Fallstudie berichtet, dass die 1.000 neuesten Patient-Chatbot-Gespräche ohne Authentifizierung abrufbar waren. Die Autoren schreiben außerdem, dass dies den eigenen Datenschutzversprechen der Bereitstellung widersprach.

Kommerzielle LLMs beschleunigten die Prüfung

Die Prüfer nutzten laut Abstract einen zweistufigen Ansatz: Claude Opus 4.6 half bei promptbasierter Exploration und Hypothesenbildung, anschließend wurden Befunde manuell mit Chrome Developer Tools überprüft. Die Autoren warnen, dass Werkzeuge, die Audits beschleunigen, auch Angreifern helfen können.

Warum das wichtig ist

RAG-Chatbots gelten oft als sicherer, weil sie Antworten aus kontrollierten Wissensquellen holen. Die Fallstudie zeigt aber: Wenn Architektur, Authentifizierung und Client-Server-Grenzen falsch gebaut sind, wird RAG selbst zum Datenschutzrisiko. Für Kliniken und Health-Tech-Anbieter in Europa ist das eine rote Linie, weil Gesundheitsdaten besonders geschützt sind.

Praktisches Beispiel

Ein deutsches Telemedizin-Startup plant einen RAG-Chatbot für 50.000 Versicherte. Vor dem Launch lässt es einen externen Security-Review durchführen: Browser-Traffic, API-Schemas, Log-Zugriffe und Retrieval-Konfiguration werden geprüft. Erst wenn keine Gespräche ohne Authentifizierung abrufbar sind und Systemprompts serverseitig bleiben, geht der Dienst in einen kontrollierten Pilotbetrieb mit 500 Nutzern.