Resumen: Los agentes de investigación de IA están demostrando un gran potencial para acelerar el progreso científico mediante la automatización del diseño, la implementación y la capacitación de modelos de aprendizaje automático. Nos centramos en los métodos para mejorar el rendimiento de los agentes en MLE-Bench, un punto de referencia desafiante donde los agentes compiten en las competiciones de Kaggle para resolver problemas de aprendizaje automático del mundo real. Formalizamos a los agentes de investigación de IA como políticas de búsqueda que navegan por un espacio de soluciones candidatas, modificándolas iterativamente utilizando operadores. Al diseñar y variar sistemáticamente diferentes conjuntos de operadores y políticas de búsqueda (codiciosas, MCTS, evolutivas), mostramos que su interacción es crítica para lograr un alto rendimiento. Nuestro mejor emparejamiento de estrategia de búsqueda y conjunto de operadores logra un resultado de última generación en MLE-Bench Lite, aumentando la tasa de éxito de lograr una medalla de Kaggle de 39.6% a 47.7%. Nuestra investigación subraya la importancia de considerar conjuntamente la estrategia de búsqueda, el diseño del operador y la metodología de evaluación en el avance del aprendizaje automático automatizado.
Publicado Originalme en export.arxiv.org El 3 de julio de 2025.
Ver Fuente Original