Resumen: Presentamos un sistema de múltiples agentes para la automatización de tareas de investigación científica, CMBagent. El sistema está formado por aproximadamente 30 agentes del modelo de lenguaje grande (LLM) e implementa una estrategia de planificación y control para orquestar el flujo de trabajo de agente, sin humanos en el bucle en ningún momento. Cada agente se especializa en una tarea diferente (realización de recuperación en documentos científicos y bases de código, escribiendo código, interpretando resultados, criticar la salida de otros agentes) y el sistema puede ejecutar código localmente. Aplicamos con éxito cmbagent para llevar a cabo una tarea de cosmología a nivel de doctorado (la medición de los parámetros cosmológicos utilizando datos de supernova) y evaluar su rendimiento en dos conjuntos de referencia, encontrando un rendimiento superior sobre las LLM de última generación. El código fuente está disponible en GitHub, los videos de demostración también están disponibles y el sistema está implementado en Huggingface y estará disponible en la nube.
Publicado Originalme en export.arxiv.org El 10 de julio de 2025.
Ver Fuente Original