LLMs em Diagnóstico Médico: diferenças entre revisões
Sem resumo de edição |
|||
(Há uma edição intermédia do mesmo utilizador que não está a ser apresentada) | |||
Linha 18: | Linha 18: | ||
'''Querry:''' Sou médico e estou de plantão na emergência. Pode sugerir as principais hipóteses diagnósticas para este caso e o raciocínio adotado: | '''Querry:''' Sou médico e estou de plantão na emergência. Pode sugerir as principais hipóteses diagnósticas para este caso e o raciocínio adotado: | ||
Paciente com 28 anos, etilista, chega a emergência com quadro de dor abdominal intensa localizada em quadrantes superiores do abdome a qual não consegue caracterizar tipologia, inicio há aproximadamente 24 horas, de caráter persistente com períodos de variação da intensidade, sem fatores claros de piora ou melhora, acompanhada por vômitos espontâneo e pós-prandial precoces. Nega irradiação ou episódios prévios semelhantes. | Paciente com 28 anos, etilista, chega a emergência com quadro de dor abdominal intensa localizada em quadrantes superiores do abdome a qual não consegue caracterizar tipologia, inicio há aproximadamente 24 horas, de caráter persistente com períodos de variação da intensidade, sem fatores claros de piora ou melhora, acompanhada por vômitos espontâneo e pós-prandial precoces. Nega irradiação ou episódios prévios semelhantes. | ||
Linha 24: | Linha 25: | ||
Resposta: Com base nos dados fornecidos, algumas hipóteses diagnósticas principais incluem: | Resposta: Com base nos dados fornecidos, algumas hipóteses diagnósticas principais incluem: | ||
'''1. Pancreatite Aguda''' | '''1. Pancreatite Aguda''' | ||
Linha 108: | Linha 110: | ||
* Considerar endoscopia digestiva. | * Considerar endoscopia digestiva. | ||
=== '''Abordagem Inicial (Conduta Geral):''' === | === '''Abordagem Inicial (Conduta Geral):''' === | ||
Edição atual desde as 21h58min de 28 de janeiro de 2025
LLMs em Diagnóstico Médico
Os modelos de linguagem ampla (LLMs) parecem trazer um avanço significativo na forma como a humanidade lida com informações e o conhecimento, o uso de Deep Learning (DL) é a essência do funcionamento de tais modelos, e conseguem predizer a próxima palavras que deve ser colocada no texto que esta a ser gerado. Tudo isso feito através do treinamento de modelos que envolvem matemática e estatística avançada.[1][2]
Com o avanço de uma ferramenta tecnológica tão revolucionária surge o importante questionamento: Como tal ferramenta pode ser utilizada para melhorar o processo de diagnóstico médico?
“Os LLMs têm o potencial de transformar a prática médica, tornando o diagnóstico mais preciso e eficiente. No entanto, é fundamental que seu desenvolvimento e aplicação sejam acompanhados de rigorosas avaliações e considerações éticas. A colaboração entre profissionais de saúde, cientistas da computação e especialistas em ética é essencial para garantir que os LLMs sejam utilizados de forma segura e benéfica para os pacientes” (Google Gemini no parágrafo de conclusão a querry: Como os LLMs podem contribuir em diagnósticos médicos atualmente e quais perspectivas futuras?)
O uso de tais ferramentas no contexto de diagnóstico médico logo começou a ser avaliado [3][4] uma vez que podem analisar grande quantidade de dados médicos e integrar a análise de diferentes tipos de dados como Imagens, textos e sons há um espaço promissor para uso na prática clínica, principalmente em situações como apoio a decisão e triagem, mas pode ser usada até mesmo para apoio a pacientes “curiosos”. No entanto ainda há um campo de incerteza nos quesitos de segurança, robustez, privacidade e explicabilidade bem como outros possíveis vieses, o que tem gerado receio no meio acadêmico e profissional em relação a como deverá ser seu uso.[3][4][5][6]
Sendo a explicabilidade uma das grandes ressalvas em relação aos modelos, tem-se desenvolvidos estratégias de elaboração do raciocínio clínico como mostrado em artigo publicado no JAMA em abril/2024 - The Journal of the American Medical Association - o raciocínio clínico foi avaliado usando R-IDEA Scores mostrando resultados promissores. Neste estudo o chatbot teve desempenho semelhante aos médicos assistentes e residentes em precisão diagnóstica, raciocínio clínico correto e diagnósticos que não podem ser perdidos. No entanto o chatbot teve casos mais frequentes de raciocínio clínico incorreto comparado aos residentes, o que não foi observado em relação aos médicos assistentes.[7]
Há atualmente diversas ferramentas (OpenAI GPT-4, Google Gemini e MedLM, Cohere Command e Meta Llama 2 dentre outras) a serem estudadas em casos reais e que estão a mostrar bons resultados tanto em exibir diagnósticos diferencias (inclusive comparado com médicos experientes) e também como a auxiliar o raciocínio clínico. Estudos tem também mostrado que a combinação de algumas delas pode otimizar ainda mais a performance dos LLM.[8][9]
Vejamos um exemplo de funcionamento do OpenAI GPT-4 (“ChatGPT”) baseado em um caso clínico de um paciente com pancreatite aguda (que embora fictício foi baseado em um caso real):
Querry: Sou médico e estou de plantão na emergência. Pode sugerir as principais hipóteses diagnósticas para este caso e o raciocínio adotado:
Paciente com 28 anos, etilista, chega a emergência com quadro de dor abdominal intensa localizada em quadrantes superiores do abdome a qual não consegue caracterizar tipologia, inicio há aproximadamente 24 horas, de caráter persistente com períodos de variação da intensidade, sem fatores claros de piora ou melhora, acompanhada por vômitos espontâneo e pós-prandial precoces. Nega irradiação ou episódios prévios semelhantes.
Paciente encontra-se consciente e orientado, tendo como alterações ao exame físico no momento: fácies de dor e dor a palpação nos quadrantes superiores do abdome.
Resposta: Com base nos dados fornecidos, algumas hipóteses diagnósticas principais incluem:
1. Pancreatite Aguda
- Raciocínio clínico:
- Dor abdominal intensa e persistente nos quadrantes superiores, com vômitos associados, é característico.
- História de etilismo é um fator de risco importante.
- Exame físico com dor à palpação nos quadrantes superiores reforça a possibilidade.
- Avaliar se há sinais sistêmicos (como febre, taquicardia ou hipotensão) e sinais de gravidade (como Cullen ou Grey-Turner).
- Próximos passos:
- Solicitar amilase e lipase séricas.
- Imagem abdominal (como ultrassonografia ou tomografia computadorizada).
2. Colecistite Aguda ou Colelitíase
- Raciocínio clínico:
- Dor nos quadrantes superiores, possivelmente no quadrante superior direito, pode sugerir patologia biliar.
- História de vômitos, dor exacerbada por alimentos gordurosos (quando aplicável).
- Etilismo não é um fator clássico, mas pode coexistir.
- Próximos passos:
- Solicitar ultrassonografia abdominal para avaliar vesícula biliar (espessamento da parede, presença de cálculos ou líquido perivesicular).
- Exames laboratoriais: leucograma, bilirrubinas, fosfatase alcalina e transaminases.
3. Hepatite Aguda ou Doença Hepática Alcoólica
- Raciocínio clínico:
- Dor nos quadrantes superiores pode ser devido a distensão da cápsula hepática por inflamação ou congestão.
- Etilismo aumenta a suspeita de hepatite alcoólica.
- Podem coexistir icterícia ou alterações laboratoriais (transaminases elevadas, padrão AST/ALT > 2:1 em hepatite alcoólica).
- Próximos passos:
- Exames laboratoriais: transaminases, bilirrubinas, GGT, albumina, INR.
- Ultrassonografia para avaliar alterações no parênquima hepático.
4. Úlcera Péptica Perfurada ou Complicada
- Raciocínio clínico:
- Dor intensa nos quadrantes superiores pode indicar úlcera gástrica ou duodenal.
- O etilismo é um fator predisponente para gastrite/úlcera.
- Avaliar sinais de peritonite, como defesa abdominal e rigidez.
- Próximos passos:
- Radiografia de abdome em pé (para pneumoperitônio).
- Endoscopia digestiva alta, se possível e estável.
5. Síndrome de Boerhaave ou Esofagite Grave
- Raciocínio clínico:
- Vômitos frequentes podem causar lesões esofágicas.
- Dor torácica ou abdominal superior deve levantar essa hipótese, especialmente se associada a sinais sistêmicos (febre, taquicardia).
- Próximos passos:
- Imagem toracoabdominal (raio-X ou TC com contraste).
- Considerar endoscopia digestiva.
Abordagem Inicial (Conduta Geral):
1. Monitorização e suporte clínico:
- Acesso venoso, hidratação vigorosa com cristalóides.
- Controle da dor (analgésicos e, se necessário, opioides).
- Correção de eletrólitos (considerar desidratação secundária a vômitos).
2. Exames laboratoriais:
- Hemograma completo, eletrólitos, amilase/lipase, função hepática (TGO/TGP, GGT, bilirrubinas), glicemia.
- Gasometria arterial (avaliar acidose metabólica ou outros distúrbios).
3. Imagens:
- Ultrassonografia de abdome.
- Tomografia computadorizada com contraste se diagnóstico não esclarecido e paciente estável.
4. Avaliação multidisciplinar:
- Cirurgia geral (se suspeita de abdome agudo perfurativo ou necessidade de intervenção cirúrgica).
- Gastroenterologia, se necessário.
Podemos ver uma resposta geral ampla, adequada ao contexto (médico na emergência) e coerente emitida pelo modelo. Vale ressaltar que é possível continuar com o aprofundamento de algum dos diagnósticos/condutas ou mesmo solicitar um número maior de diagnósticos diferenciais, incluindo alguns mais raros para o caso.
Apesar de se tratar de um caso simples e levando em conta que há ainda muito o que ser aprimorado e testado para garantirmos a segurança do seu uso rotineiro na prática clínica, vemos uma ferramenta bastante promissora como protótipo.
- ↑ Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N.,& Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems https://arxiv.org/abs/1706.03762
- ↑ Wenxuan Li - The Advance of Deep Learning Based Named Entity Recognition - https://doi.org/10.54097/hset.v12i.1368
- ↑ 3,0 3,1 doi: 10.1016/j.isci.2024.109713 The application of large language models in medicine: A scoping review
- ↑ 4,0 4,1 Singhal, K., Azizi, S., Tu, T. et al. Large language models encode clinical knowledge. Nature 620, 172–180 (2023). https://doi.org/10.1038/s41586-023-06291-2
- ↑ Savage, T., Nayak, A., Gallo, R. et al. Diagnostic reasoning prompts reveal the potential for large language model interpretability in medicine. npj Digit. Med. 7, 20 (2024). https://doi.org/10.1038/s41746-024-01010-1
- ↑ doi:10.1001/jamainternmed.2023.1835. How Chatbots and Large Language Model Artificial Intelligence Systems Will Reshape Modern Medicine: Fountain of Creativity or Pandora’s Box?
- ↑ Cabral, S., Restrepo, D., Kanjee, Z., Wilson, P., Crowe, B., Abdulnour, R.-E., Rodman, A. (2024). Clinical Reasoning of a Generative Artificial Intelligence Model Compared With Physicians. JAMA Intern Med., 184(5), 581-583. https://jamanetwork.com/journals/jamainternalmedicine/fullarticle/2817046
- ↑ https://arxiv.org/abs/2312.00164
- ↑ DOI: 10.1056/AIcs2400502