Resumen: Los modelos de lenguaje amplio aplicados a la predicción clínica exhiben heterogeneidad a nivel de caso: los casos simples producen resultados consistentes, mientras que los casos complejos producen predicciones divergentes bajo cambios rápidos menores. Las estrategias existentes de un solo agente toman muestras de una distribución condicionada por roles, y los marcos de múltiples agentes utilizan roles fijos con votación por mayoría plana, descartando la señal de diagnóstico en caso de desacuerdo. Proponemos CAMP (Panel de agentes múltiples adaptativo de casos), donde un agente médico tratante reúne dinámicamente un panel de especialistas adaptado a la incertidumbre diagnóstica de cada caso. Cada especialista evalúa a los candidatos mediante una votación de tres valores (MANTENER/RECHAZAR/NEUTRAL), lo que permite una abstención por principios fuera de su experiencia. Un enrutador híbrido dirige cada diagnóstico a través de un fuerte consenso, recurriendo al criterio del médico tratante o arbitraje basado en evidencia que sopesa la calidad de los argumentos sobre el recuento de votos. En cuanto a la predicción de diagnóstico y la generación de cursos hospitalarios breves desde MIMIC-IV en cuatro pilares de LLM, CAMP supera consistentemente líneas de base sólidas y consume menos tokens que la mayoría de los métodos de múltiples agentes de la competencia, con registros de votación y seguimientos de arbitraje que ofrecen auditorías de decisiones transparentes.
Publicado originalmente en export.arxiv.org el 1 de abril de 2026.
Ver fuente original
