Agentes de investigación de IA para el aprendizaje automático: búsqueda, exploración y generalización en MLE-Bench

Resumen: Los agentes de investigación de IA están demostrando un gran potencial para acelerar el progreso científico mediante la automatización del diseño, la implementación y la capacitación de modelos de aprendizaje automático. Nos centramos en los métodos para mejorar el rendimiento de los agentes en MLE-Bench, un punto de referencia desafiante donde los agentes compiten en las competiciones de Kaggle para resolver problemas de aprendizaje automático del mundo real. Formalizamos a los agentes de investigación de IA como políticas de búsqueda que navegan por un espacio de soluciones candidatas, modificándolas iterativamente utilizando operadores. Al diseñar y variar sistemáticamente diferentes conjuntos de operadores y políticas de búsqueda (codiciosas, MCTS, evolutivas), mostramos que su interacción es crítica para lograr un alto rendimiento. Nuestro mejor emparejamiento de estrategia de búsqueda y conjunto de operadores logra un resultado de última generación en MLE-Bench Lite, aumentando la tasa de éxito de lograr una medalla de Kaggle de 39.6% a 47.7%. Nuestra investigación subraya la importancia de considerar conjuntamente la estrategia de búsqueda, el diseño del operador y la metodología de evaluación en el avance del aprendizaje automático automatizado.

Publicado Originalme en export.arxiv.org El 3 de julio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

PreScience: un punto de referencia para pronosticar contribuciones científicas

Uso de un modelo de lenguaje grande multimodal para mejorar la capacidad del algoritmo de Fireworks para resolver tareas de optimización desafiantes

Hacia la certificación basada en la madurez de la IA incorporada: cuantificar la confiabilidad a través de mecanismos de medición

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido