Resumen: Los avances recientes en los modelos multimodales de lenguaje grande se han expandido rápidamente a los electrocardiogramas, centrándose en la clasificación, la generación de informes y las tareas de control de calidad de un solo turno. Sin embargo, estos modelos se quedan cortos en escenarios del mundo real, ya que carecen de capacidad de conversación en múltiples turnos, eficiencia en el dispositivo y comprensión precisa de las mediciones de ECG, como los intervalos PQRST. Para abordar estas limitaciones, presentamos ECG-Agent, el primer agente de llamada de herramientas basado en LLM para el diálogo de ECG de múltiples turnos. Para facilitar su desarrollo y evaluación, también presentamos el conjunto de datos ECG-Multi-Turn-Dialogue (ECG-MTD), una colección de diálogos realistas de múltiples turnos del asistente del usuario para diversas configuraciones de cables de ECG. Desarrollamos agentes de ECG en varios tamaños, desde agentes capaces en el dispositivo hasta agentes más grandes. Los resultados experimentales muestran que los agentes de ECG superan a los ECG-LLM de referencia en cuanto a precisión de respuesta. Además, los agentes en el dispositivo logran un rendimiento comparable al de agentes más grandes en varias evaluaciones que evalúan la precisión de la respuesta, la capacidad de invocación de herramientas y las alucinaciones, lo que demuestra su viabilidad para aplicaciones del mundo real.
Publicado originalmente en export.arxiv.org el 28 de enero de 2026.
Ver fuente original
