Eine cluster-randomisierte Studie hat gezeigt, dass der Einsatz eines großen Sprachmodells zur automatisierten Bewertung der CMS-Qualitätskennzahl SEP-1 (Severe Sepsis and Septic Shock Management Bundle) und die zeitnahe Rückmeldung an behandelnde Ärzte die Compliance mit dieser Kennzahl signifikant erhöhen kann. Die Studie wurde in JAMA Network Open veröffentlicht.
In der Untersuchung wurden 66 Notfallmediziner an zwei Universitätskliniken der University of California, San Diego, randomisiert. Insgesamt behandelten die Ärzte 301 Patienten, die die Einschlusskriterien für die SEP-1-Kennzahl erfüllten. Die Interventionsgruppe erhielt bei Entlassung eine automatisierte, auf Large-Language-Model basierende Bewertung der SEP-1-Compliance mit gezielter Rückmeldung. Die Kontrollgruppe arbeitete nach dem üblichen Verfahren.
Die Compliance mit der SEP-1-Kennzahl lag in der Interventionsgruppe bei 82,9 Prozent und in der Kontrollgruppe bei 70,1 Prozent. Dies entsprach einer absoluten Verbesserung von 13,0 Prozentpunkten (Odds Ratio 2,10; 95%-Konfidenzintervall 1,15–3,81; P = 0,02). Der größte Unterschied zeigte sich beim Abschluss des 30-ml/kg-Flüssigkeitsbolus, der in der Interventionsgruppe seltener unterlassen wurde.
Die Übereinstimmung zwischen der automatisierten LLM-Bewertung und der manuellen Expertenprüfung betrug 92 Prozent. Es fanden sich keine signifikanten Unterschiede zwischen den Gruppen hinsichtlich der 30-Tage-Mortalität oder der Aufnahmen auf die Intensivstation.
Die Studie demonstriert, dass KI-gestützte, zeitnahe Qualitätsmessung und Feedback die Einhaltung komplexer Qualitätskennzahlen verbessern können. Die Autoren sehen darin einen Ansatz, um bestehende Limitationen manueller Qualitätsberichterstattung zu überwinden und ein lernendes Gesundheitssystem zu unterstützen. Gleichzeitig bleibt offen, ob die verbesserte Compliance mit der Kennzahl auch zu klinisch relevanten Verbesserungen der Patientenoutcomes führt. Die Studie wurde an nur zwei Zentren durchgeführt und untersuchte ausschließlich die SEP-1-Kennzahl, sodass die Übertragbarkeit auf andere Settings und Qualitätsindikatoren noch zu prüfen ist.
