ProSEA: resolución de problemas a través de agentes de exploración

Resumen: Los modelos de lenguajes grandes (LLM) han permitido a los agentes de IA abordar tareas cada vez más complejas. Sin embargo, la mayoría de los agentes existentes siguen limitados a una planificación estática y a interacciones frágiles, sin alcanzar una verdadera colaboración o un razonamiento adaptativo. Presentamos ProSEA, un marco modular de múltiples agentes de propósito general diseñado para la resolución iterativa de problemas a través de la exploración y la evolución de planes. ProSEA presenta una arquitectura jerárquica en la que un agente administrador organiza agentes expertos especializados en el dominio, descompone tareas y replanifica de forma adaptativa basándose en comentarios estructurados de intentos fallidos. A diferencia de los sistemas anteriores, los agentes ProSEA informan no solo del éxito o el fracaso, sino también de los motivos detallados del fracaso y de las limitaciones recién descubiertas, lo que permite un refinamiento dinámico del plan informado por seguimientos exploratorios. El marco funciona de forma autónoma pero admite una integración perfecta con colaboradores humanos cuando es necesario. Los experimentos en el desafiante banco de pruebas FinanceBench demuestran que ProSEA, incluso sin retroalimentación humana, supera las bases de referencia de última generación y logra un rendimiento sólido en tareas que requieren mucho razonamiento. Estos resultados subrayan el potencial de ProSEA como base para agentes de IA más transparentes, adaptables y alineados con los humanos.

Publicado originalmente en export.arxiv.org el 9 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

El caso contra los humanos en el espacio

Pensar más allá de las fichas: desde la inteligencia inspirada en el cerebro hasta las fundaciones cognitivas para la inteligencia general artificial y su impacto social

Agentes cardíacos: un marco multimodal con adaptación jerárquica para el soporte de cuidado cardíaco

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido