Resumen: Los avances recientes en la intersección de los grandes modelos lingüísticos (LLM) y el análisis de series temporales (TS) han revelado tanto promesa como fragilidad. Si bien los LLM pueden razonar sobre la estructura temporal dado un contexto cuidadosamente diseñado, a menudo tienen dificultades con la fidelidad numérica, la interferencia de modalidades y la integración intermodal de principios. Presentamos TS-Debate, un marco de debate colaborativo de múltiples agentes especializado en modalidades para el razonamiento de series temporales de disparo cero. TS-Debate asigna agentes expertos dedicados al contexto textual, patrones visuales y señales numéricas, precedidos por una obtención explícita de conocimiento del dominio, y coordina su interacción a través de un protocolo de debate estructurado. Los agentes revisores evalúan las reclamaciones de los agentes mediante un mecanismo de verificación, conflicto y calibración, respaldado por una ejecución de código liviano y búsqueda numérica para verificación programática. Esta arquitectura preserva la fidelidad de la modalidad, expone evidencia contradictoria y mitiga las alucinaciones numéricas sin realizar ajustes específicos de la tarea. A través de 20 tareas que abarcan tres puntos de referencia públicos, TS-Debate logra mejoras de rendimiento consistentes y significativas sobre líneas de base sólidas, incluido el debate multimodal estándar en el que todos los agentes observan todas las entradas.
Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original
