Un marco multimodal múltiple para la generación de informes de radiología

Resumen: La generación de informes de radiología (RRG) tiene como objetivo producir automáticamente informes de diagnóstico a partir de imágenes médicas, con el potencial de mejorar los flujos de trabajo clínicos y reducir la carga de trabajo de los radiólogos. Si bien los enfoques recientes que aprovechan los modelos de idiomas grandes (MLLM) y la generación de recuperación acuática (RAG) han logrado fuertes resultados, continúan enfrentando desafíos como la inconsistencia objetiva, la alucinación y la desalineación intermodal. Proponemos un marco multimodal múltiple de agente para RRG que se alinea con el flujo de trabajo de razonamiento clínico gradual, donde los agentes específicos de la tarea manejan la recuperación, la generación de borradores, el análisis visual, el refinamiento y la síntesis. Los resultados experimentales demuestran que nuestro enfoque supera a una línea de base fuerte tanto en las métricas automáticas como en las evaluaciones basadas en LLM, produciendo informes más precisos, estructurados e interpretables. Este trabajo destaca el potencial de los marcos múltiples de agentes clínicamente alineados para apoyar aplicaciones de IA clínicas explicables y confiables.

Publicado Originalme en rss.arxiv.org El 15 de mayo de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

¿Puedo recibir su pedido? Búsqueda de árbol de Monte-Carlo para ordenar el llenado de espacios en modelos de lenguaje de difusión

Reasonbridge: transferencia de razonamiento eficiente de los modelos de lenguaje cerrado a de código abierto

Vodafone crosses 200M IoT connections milestone

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido