En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Un marco multimodal múltiple para la generación de informes de radiología

Un marco multimodal múltiple para la generación de informes de radiología

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La generación de informes de radiología (RRG) tiene como objetivo producir automáticamente informes de diagnóstico a partir de imágenes médicas, con el potencial de mejorar los flujos de trabajo clínicos y reducir la carga de trabajo de los radiólogos. Si bien los enfoques recientes que aprovechan los modelos de idiomas grandes (MLLM) y la generación de recuperación acuática (RAG) han logrado fuertes resultados, continúan enfrentando desafíos como la inconsistencia objetiva, la alucinación y la desalineación intermodal. Proponemos un marco multimodal múltiple de agente para RRG que se alinea con el flujo de trabajo de razonamiento clínico gradual, donde los agentes específicos de la tarea manejan la recuperación, la generación de borradores, el análisis visual, el refinamiento y la síntesis. Los resultados experimentales demuestran que nuestro enfoque supera a una línea de base fuerte tanto en las métricas automáticas como en las evaluaciones basadas en LLM, produciendo informes más precisos, estructurados e interpretables. Este trabajo destaca el potencial de los marcos múltiples de agentes clínicamente alineados para apoyar aplicaciones de IA clínicas explicables y confiables.

Publicado Originalme en rss.arxiv.org El 15 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web