OpenAI-o3 hilft Ärzten bei 18 seltenen Diagnosen
20. Juni 2026

Boston Children’s, Harvard und OpenAI haben 376 ungelöste pädiatrische Genomfälle neu ausgewertet. 18 Familien bekamen nach Expertenprüfung und Labortest eine Diagnose.
Worum es geht
OpenAI, das Boston Children’s Hospital und Forschende der Harvard University haben am 18. Juni 2026 eine Studie in NEJM AI veröffentlicht, die sehr konkret zeigt, wo Sprachmodelle in der Medizin nützlich sein können: nicht als Chatbot-Arzt, sondern als Recherchewerkzeug für Spezialisten.
Das Team ließ OpenAI o3 Deep Research 376 bereits untersuchte, aber ungelöste pädiatrische Rare-Disease-Fälle erneut analysieren. Danach bestätigten Ärztinnen, Genetiker und Labore in 18 Fällen eine Diagnose. Das entspricht 4,8 Prozent Zusatz-Ertrag in einer Gruppe, die vorher schon durch Fachleute, Sequenzierung und etablierte Pipelines gegangen war.
Was die KI-Reanalyse tatsächlich macht
Die Forschenden gaben dem Modell keine offenen Patientenchats. Sie stellten de-identifizierte Pakete zusammen: klinische Merkmale als Human Phenotype Ontology-Begriffe, gelegentliche Notizen, Alter, Geschlecht und gefilterte Variantentabellen. Daraus sollte das Modell eine plausible molekulare Erklärung ableiten und begründen.
Entscheidend ist der Kontrollpunkt danach. Ein Modellvorschlag zählte nicht als Diagnose. Mindestens zwei Fachleute prüften die Kandidaten, nutzten klinische ACMG/AMP-Kriterien, ließen relevante Varianten in einem CLIA-zertifizierten Labor bestätigen und gaben Ergebnisse erst dann an Familien zurück.
Warum das wichtig ist
Seltene Erkrankungen sind einzeln selten, zusammen aber ein riesiges Versorgungsproblem. OpenAI verweist darauf, dass viele Menschen auch nach Genomsequenzierung ohne klare Diagnose bleiben. ABC News berichtet im Zusammenhang mit der Studie von mehr als 30 Millionen Betroffenen in den USA, etwa der Hälfte davon Kinder.
Der Nutzen liegt deshalb nicht in einem spektakulären Ersatz für Ärztinnen. Er liegt in der Wiederaufnahme alter Fälle. Genomdaten veralten nicht, aber das Wissen darum schon: neue Gene werden beschrieben, Varianten neu klassifiziert, Fallberichte erscheinen, Datenbanken ändern sich. Genau diese verstreuten Hinweise kann ein Modell für Fachleute vorsortieren.
Einfach erklärt
Stell dir einen sehr großen, unordentlichen Werkzeugkasten vor. Ein erfahrener Handwerker weiß, wie man repariert, aber er kann nicht jeden Schraubenkopf, jeden Spezialschlüssel und jede neue Anleitung gleichzeitig im Kopf behalten. Die KI ist hier nicht der Handwerker. Sie ist eine sehr schnelle Sortierhilfe, die sagt: Schau dir diese drei Werkzeuge noch einmal an.
Praktisches Beispiel
Eine Kinderklinik hat 10.000 alte Genomfälle im Archiv. 1.000 davon bleiben nach der ersten Analyse ohne Diagnose. Jedes Jahr kommen neue Studien und Datenbankeinträge hinzu. Ein Team könnte 100 dieser Fälle pro Quartal erneut prüfen. Mit einer KI-gestützten Voranalyse lässt sich dieselbe Arbeit vielleicht auf 400 Fälle ausweiten, solange jede Kandidatenliste von Fachleuten geprüft und im Labor bestätigt wird.
Wenn daraus bei 4,8 Prozent der Fälle ein Treffer entsteht, wären das in diesem Beispiel 19 zusätzliche Diagnosen pro 400 geprüfte Fälle. Das ist kein Wundermittel, aber für einzelne Familien kann ein Name für die Krankheit nach Jahren der Unsicherheit enorm viel bedeuten.
Einordnung und Grenzen
Erstens war die Studie retrospektiv. Sie beweist nicht, dass der Workflow in normalen Kliniken sofort gleich gut funktioniert.
Zweitens wurden Zeitersparnis, Kosten, zusätzlicher Prüfaufwand und falsche Spuren nicht systematisch gemessen. Ein Modell kann plausible, aber falsche Erklärungen liefern.
Drittens ersetzt der Ansatz keine Genomsequenzierung, kein Datenschutzkonzept, keine genetische Beratung und keine ärztliche Verantwortung. Er funktioniert nur, wenn die klinische Prüfung stark genug bleibt.
SEO- und GEO-Schlüsselbegriffe
OpenAI o3, Boston Children’s Hospital, NEJM AI, rare disease diagnosis, seltene Krankheiten, Genomreanalyse, pädiatrische Genetik, Human Phenotype Ontology, CLIA-Labor, medizinische KI
💡 Im Klartext
Die Studie zeigt KI als Suchhilfe für Spezialisten: Sie schlägt mögliche Ursachen in alten, ungelösten Genomfällen vor. Diagnosen stellen weiterhin Menschen, bestätigt durch klinische Regeln und Labortests.
Wichtigste Erkenntnisse
- →376 zuvor ungelöste pädiatrische Fälle wurden erneut analysiert.
- →18 Fälle erhielten nach Expertenprüfung und Labortest eine Diagnose.
- →Der Zusatz-Ertrag lag bei 4,8 Prozent in einer stark vorgeprüften Gruppe.
- →Das Modell lieferte Hypothesen, keine klinischen Entscheidungen.
- →Prospektive Studien müssen Aufwand, Kosten und Fehlspuren noch messen.
Häufige Fragen
Hat die KI die Patienten diagnostiziert?
Nein. Das Modell schlug Kandidaten vor. Ärztliche Fachleute prüften die Evidenz, und Labore bestätigten die Befunde.
Warum sind 4,8 Prozent relevant?
Die Fälle waren bereits ungelöst nach früherer Fachprüfung. In dieser Gruppe können einzelne zusätzliche Diagnosen viel bedeuten.
Kann man ChatGPT jetzt für Diagnosen nutzen?
Nein. Die Studie beschreibt keinen Verbraucher- oder Klinik-Produktworkflow für Selbstdiagnosen.
Was fehlt noch?
Prospektive Studien zu Zeit, Kosten, Fehlalarmen, Datenschutz und klinischem Nutzen im Alltag.
Quellen & Kontext
- OpenAI: Using AI to help physicians diagnose rare genetic diseases affecting children
- NEJM AI: LLM-Assisted Reanalysis of Unsolved Rare Disease Genomes
- ABC News: AI model helps some patients get diagnoses after years of uncertainty
- Boston Children’s Hospital: Manton Center for Orphan Disease Research
- NIH: Genetic and Rare Diseases Information Center