Resumen:Los modelos de lenguajes grandes (LLM) están catalizando el desarrollo de agentes de investigación de IA autónomos para descubrimientos científicos y de ingeniería. Presentamos FM Agent, un marco multiagente novedoso y de propósito general que aprovecha una combinación sinérgica de razonamiento basado en LLM y búsqueda evolutiva a gran escala para abordar desafíos complejos del mundo real. El núcleo de FM Agent integra varias innovaciones clave: 1) una fase de inicialización en frío que incorpora orientación experta, 2) una novedosa estrategia de muestreo evolutivo para la optimización iterativa, 3) evaluadores de dominios específicos que combinan corrección, efectividad y retroalimentación supervisada por LLM, y 4) una infraestructura de ejecución asincrónica distribuida construida sobre Ray. Nuestro sistema, que demuestra una amplia aplicabilidad, ha sido evaluado en diversos dominios, incluida la investigación de operaciones, el aprendizaje automático, la optimización del kernel de GPU y los problemas matemáticos clásicos. FM Agent alcanza resultados de última generación de forma autónoma, sin interpretación ni ajustes humanos: 1976,3 en ALE-Bench (+5,2%), 43,56% en MLE-Bench (+4,0pp), aceleraciones de hasta 20x en KernelBench y establece nuevos resultados de última generación (SOTA) en varios problemas matemáticos clásicos. Más allá de los puntos de referencia académicos, FM Agent muestra una promesa considerable tanto para los flujos de trabajo de I+D empresarial a gran escala como para la investigación científica fundamental, donde puede acelerar la innovación, automatizar procesos de descubrimiento complejos y ofrecer importantes avances científicos y de ingeniería con un impacto social más amplio.
Publicado originalmente en export.arxiv.org el 30 de octubre de 2025.
Ver fuente original
