TS-Debate: Debate colaborativo multimodal para el razonamiento de series temporales de disparo cero

Resumen: Los avances recientes en la intersección de los grandes modelos lingüísticos (LLM) y el análisis de series temporales (TS) han revelado tanto promesa como fragilidad. Si bien los LLM pueden razonar sobre la estructura temporal dado un contexto cuidadosamente diseñado, a menudo tienen dificultades con la fidelidad numérica, la interferencia de modalidades y la integración intermodal de principios. Presentamos TS-Debate, un marco de debate colaborativo de múltiples agentes especializado en modalidades para el razonamiento de series temporales de disparo cero. TS-Debate asigna agentes expertos dedicados al contexto textual, patrones visuales y señales numéricas, precedidos por una obtención explícita de conocimiento del dominio, y coordina su interacción a través de un protocolo de debate estructurado. Los agentes revisores evalúan las reclamaciones de los agentes mediante un mecanismo de verificación, conflicto y calibración, respaldado por una ejecución de código liviano y búsqueda numérica para verificación programática. Esta arquitectura preserva la fidelidad de la modalidad, expone evidencia contradictoria y mitiga las alucinaciones numéricas sin realizar ajustes específicos de la tarea. A través de 20 tareas que abarcan tres puntos de referencia públicos, TS-Debate logra mejoras de rendimiento consistentes y significativas sobre líneas de base sólidas, incluido el debate multimodal estándar en el que todos los agentes observan todas las entradas.

Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La descarga: aumentar la memoria de la IA y los vecinos descontentos de los centros de datos

Una arquitectura de razonamiento neuro-simbólico completamente espectral con procesamiento de señales gráficas como esqueleto computacional

Crisis-Bench: Evaluación comparativa de la ambigüedad estratégica y la gestión de la reputación en modelos de lenguaje grandes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido