Resumen: El corpus de abstracción y razonamiento para la inteligencia general artificial (ARC-AGI), introducida en 2019, estableció un punto de referencia desafiante para evaluar la inteligencia fluida general de los sistemas artificiales a través de un conjunto de tareas únicas y novedosas que solo requieren un conocimiento previo mínimo. Si bien ARC-AGI ha estimulado una actividad de investigación significativa en los últimos cinco años, el progreso reciente de IA requiere puntos de referencia capaces de una evaluación de grano más fino en niveles más altos de complejidad cognitiva. Presentamos ARC-AGI-2, una versión actualizada del punto de referencia. ARC-AGI-2 conserva el formato de tarea de par de entrada-salida de su predecesor, asegurando la continuidad para los investigadores. Incorpora un conjunto de tareas recién curados y ampliados diseñados específicamente para proporcionar una señal más granular para evaluar el razonamiento abstracto y las habilidades de resolución de problemas en niveles más altos de inteligencia de fluidos. Para contextualizar la dificultad y las características de ARC-AGI-2, presentamos resultados extensos de las pruebas humanas, proporcionando una línea de base robusta que resalta la accesibilidad del punto de referencia a la inteligencia humana, pero la dificultad para los sistemas de IA actuales. ARC-AGI-2 tiene como objetivo servir como una herramienta de próxima generación para medir rigurosamente el progreso hacia capacidades de IA más generales y humanos.
Publicado Originalme en rss.arxiv.org El 19 de mayo de 2025.
Ver Fuente Original