Um estudo randomizado por cluster mostrou que o uso de um modelo de linguagem grande para avaliar automaticamente o indicador de qualidade CMS SEP-1 (Severe Sepsis and Septic Shock Management Bundle) e o feedback oportuno aos médicos tratantes podem aumentar significativamente a conformidade com este indicador. O estudo foi publicado na JAMA Network Open.
Na investigação, 66 médicos de emergência em dois hospitais universitários da University of California, San Diego, foram randomizados. No total, os médicos trataram 301 pacientes que atendiam aos critérios de inclusão para o indicador SEP-1. O grupo de intervenção recebeu uma avaliação automatizada da conformidade com o SEP-1 baseada em modelo de linguagem grande com feedback direcionado na alta. O grupo de controle trabalhou de acordo com o procedimento usual.
A conformidade com o indicador SEP-1 foi de 82,9% no grupo de intervenção e de 70,1% no grupo de controle. Isso correspondeu a uma melhoria absoluta de 13,0 pontos percentuais (Odds Ratio 2,10; intervalo de confiança de 95% 1,15–3,81; P = 0,02). A maior diferença foi observada na conclusão do bolus de fluidos de 30 ml/kg, que foi menos frequentemente omitido no grupo de intervenção.
A concordância entre a avaliação automatizada por LLM e a revisão manual por especialistas foi de 92%. Não foram encontradas diferenças significativas entre os grupos em relação à mortalidade em 30 dias ou às internações em unidade de terapia intensiva.
O estudo demonstra que a medição de qualidade e o feedback oportunos, auxiliados por IA, podem melhorar a adesão a indicadores de qualidade complexos. Os autores veem isso como uma abordagem para superar as limitações existentes da relatoria manual de qualidade e apoiar um sistema de saúde que aprende. Ao mesmo tempo, permanece em aberto se a conformidade aprimorada com o indicador também leva a melhorias clinicamente relevantes nos desfechos dos pacientes. O estudo foi realizado em apenas dois centros e examinou exclusivamente o indicador SEP-1, de modo que a transferibilidade para outros cenários e indicadores de qualidade ainda precisa ser verificada.
