Resumen: Los modelos de lenguajes grandes (LLM) han permitido a los agentes de IA abordar tareas cada vez más complejas. Sin embargo, la mayoría de los agentes existentes siguen limitados a una planificación estática y a interacciones frágiles, sin alcanzar una verdadera colaboración o un razonamiento adaptativo. Presentamos ProSEA, un marco modular de múltiples agentes de propósito general diseñado para la resolución iterativa de problemas a través de la exploración y la evolución de planes. ProSEA presenta una arquitectura jerárquica en la que un agente administrador organiza agentes expertos especializados en el dominio, descompone tareas y replanifica de forma adaptativa basándose en comentarios estructurados de intentos fallidos. A diferencia de los sistemas anteriores, los agentes ProSEA informan no solo del éxito o el fracaso, sino también de los motivos detallados del fracaso y de las limitaciones recién descubiertas, lo que permite un refinamiento dinámico del plan informado por seguimientos exploratorios. El marco funciona de forma autónoma pero admite una integración perfecta con colaboradores humanos cuando es necesario. Los experimentos en el desafiante banco de pruebas FinanceBench demuestran que ProSEA, incluso sin retroalimentación humana, supera las bases de referencia de última generación y logra un rendimiento sólido en tareas que requieren mucho razonamiento. Estos resultados subrayan el potencial de ProSEA como base para agentes de IA más transparentes, adaptables y alineados con los humanos.
Publicado originalmente en export.arxiv.org el 9 de octubre de 2025.
Ver fuente original
