一项集群随机试验表明,使用大型语言模型自动评估 CMS 质量指标 SEP-1(严重脓毒症和脓毒性休克管理组合)并及时向临床医生提供反馈,可以显著提高该指标的依从性。该研究发表在《JAMA Network Open》上。
该研究对加州大学圣地亚哥分校两所大学医院的 66 名急诊科医生进行了随机分组。医生们总共治疗了 301 名符合 SEP-1 指标纳入标准的患者。干预组在出院时收到了基于大型语言模型的 SEP-1 合规性自动评估和有针对性的反馈。对照组则按常规流程进行。
干预组对 SEP-1 指标的依从性为 82.9%,对照组为 70.1%。这相当于绝对提高了 13.0 个百分点(优势比 2.10;95% 置信区间 1.15–3.81;P = 0.02)。在完成 30 ml/kg 液体推注方面差异最大,干预组中较少出现遗漏。
自动 LLM 评估与手动专家审查之间的一致性为 92%。两组在 30 天死亡率或重症监护室入住率方面没有发现显著差异。
该研究表明,人工智能驱动的及时质量测量和反馈可以提高对复杂质量指标的依从性。研究人员认为,这是一种克服手动质量报告局限性并支持学习型医疗保健系统的方法。然而,依从性提高是否能带来临床上相关的患者结局改善仍有待观察。该研究仅在两个中心进行,并且仅考察了 SEP-1 指标,因此其可推广性到其他环境和质量指标仍需进一步评估。
