KI-Erklärungen verbessern Diagnosen in der Radiologie

München (ots)

Eine neue Studie zeigt, dass KI-Modelle wie ChatGPT die diagnostische Genauigkeit in der Radiologie verbessern können
Nicht jede Form der KI-Hilfe ist dabei gleich hilfreich. Entscheidend ist, ob die Ärztinnen und Ärzte die Empfehlung nachvollziehen und kritisch prüfen können.
Knappe Antworten oder reine Listen können dagegen Fehlvertrauen fördern.

Ein Forschungsteam der LMU München, des LMU Klinikums, des Karlsruher Instituts für Technologie und der Universität Bayreuth untersuchte, wie unterschiedliche Formen von KI-Erklärungen die diagnostische Genauigkeit in der Radiologie beeinflussen.

Aufbau der Studie

In einem randomisierten Experiment beurteilten 101 Radiologinnen und Radiologen reale klinische Fälle mit radiologischen Bildern, etwa aus der Computertomographie (CT) oder der Magnetresonanztomographie (MRT), und sollten jeweils eine Diagnose als Freitext formulieren. Die Teilnehmenden wurden zufällig vier Gruppen zugeteilt: eine arbeitete ohne KI-Unterstützung, drei weitere erhielten unterschiedliche Hinweise eines multimodalen Sprachmodells. Die KI gab entweder nur eine Diagnose, eine Differentialdiagnose oder eine schrittweise "Chain-of-Thought"-Erklärung aus.

Boj Friedrich Hoppe vom LMU Klinikum betont: "In der Radiologie geht es oft darum, komplexe Bildbefunde mit klinischen Informationen zusammenzuführen". Er ergänzt: "Sprachmodelle können hier prinzipiell unterstützen. Unsere Studie zeigt aber, dass nicht jede Form von KI-Hilfe gleich hilfreich ist. Entscheidend ist, ob die Ärztinnen und Ärzte die Empfehlung nachvollziehen und kritisch prüfen können."

Ergebnisse

Die Radiologinnen und Radiologen erzielten die höchste diagnostische Genauigkeit mit schrittweisen KI-Erklärungen: die Trefferquote lag 12,2 Prozentpunkte über der Kontrollgruppe ohne KI. Einfache Diagnoseausgaben und Differentialdiagnosen schnitten schlechter ab.

Die Forschenden beobachteten zudem Hinweise auf Automationsbias: Besonders bei fehlerhaften KI-Vorschlägen folgten Teilnehmende der Differentialdiagnose häufiger. Schritt-für-Schritt-Erklärungen halfen dagegen, korrekte Hinweise gezielter zu übernehmen und Fehler eher zu erkennen.

Die Studie legt nahe, dass nicht allein die Qualität der Diagnose entscheidend ist, sondern auch die Form der Erklärung. "Für die klinische Praxis ist es nicht ausreichend, wenn ein KI-System nur eine plausibel klingende Antwort gibt", so Hoppe. "Ärztinnen und Ärzte müssen nachvollziehen können, welche Hinweise für eine Diagnose sprechen und wo mögliche Unsicherheiten liegen."

Bedeutung und Vorsicht

Stefan Feuerriegel, Professor an der LMU Munich School of Management und korrespondierender Autor, weist darauf hin, dass die Ergebnisse über die Radiologie hinausreichen: "Unsere Ergebnisse zeigen: Wer nicht nur nach einer Antwort fragt, sondern auch nach einer nachvollziehbaren Begründung, kann solche Systeme deutlich besser nutzen." Er ergänzt: "Eine gute KI-Antwort ist nicht nur korrekt, sondern überprüfbar."

Die Forschenden betonen, dass Sprachmodelle Fehler machen können — sowohl bei Diagnosen als auch bei deren Begründung. Die Studie zeigt: KI verbessert die diagnostische Leistung vor allem dann, wenn ihre Vorschläge nachvollziehbar präsentiert werden. Knappe Antworten oder reine Listen können dagegen Fehlvertrauen fördern.

Publikation

Philipp Spitzer, Daniel Hendriks, Jan Rudolph, Sarah Schlaeger, Jens Ricke, Niklas Kühl, Boj Friedrich Hoppe & Stefan Feuerriegel: The effect of medical explanations from large language models on diagnostic accuracy in radiology. In: npj Digital Medicine, Volume 9, Article 33, 2026. https://www.nature.com/articles/s41746-026-02619-0

Kontakt
Kontakt: Prof. Stefan Feuerriegel
Head of Institute of Artificial Intelligence (AI) in Management, LMU
E-Mail:
Tel.: +491627246860

KI-Erklärungen verbessern Diagnosen in der Radiologie

Aufbau der Studie

Ergebnisse

Bedeutung und Vorsicht

Schlagworte

Weitere Meldungen

KI-Erklärungen in der Radiologie: Besser diagnostizieren

Last Loop: Wiener KI-Startup launcht neue Business-Plattform

DPU macht Forschung bei Langer Nacht der Forschung erlebbar