ARC-AGI-2: Un nuevo desafío para los sistemas de razonamiento de AI fronteriza

Resumen: El corpus de abstracción y razonamiento para la inteligencia general artificial (ARC-AGI), introducida en 2019, estableció un punto de referencia desafiante para evaluar la inteligencia fluida general de los sistemas artificiales a través de un conjunto de tareas únicas y novedosas que solo requieren un conocimiento previo mínimo. Si bien ARC-AGI ha estimulado una actividad de investigación significativa en los últimos cinco años, el progreso reciente de IA requiere puntos de referencia capaces de una evaluación de grano más fino en niveles más altos de complejidad cognitiva. Presentamos ARC-AGI-2, una versión actualizada del punto de referencia. ARC-AGI-2 conserva el formato de tarea de par de entrada-salida de su predecesor, asegurando la continuidad para los investigadores. Incorpora un conjunto de tareas recién curados y ampliados diseñados específicamente para proporcionar una señal más granular para evaluar el razonamiento abstracto y las habilidades de resolución de problemas en niveles más altos de inteligencia de fluidos. Para contextualizar la dificultad y las características de ARC-AGI-2, presentamos resultados extensos de las pruebas humanas, proporcionando una línea de base robusta que resalta la accesibilidad del punto de referencia a la inteligencia humana, pero la dificultad para los sistemas de IA actuales. ARC-AGI-2 tiene como objetivo servir como una herramienta de próxima generación para medir rigurosamente el progreso hacia capacidades de IA más generales y humanos.

Publicado Originalme en rss.arxiv.org El 19 de mayo de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Entrenamiento de datos sintéticos multimodales y colapso del modelo: ideas de VLMS y modelos de difusión

AgentsGen: LLM de múltiples agentes en el bucle para la colaboración semántica y la generación de datos sintéticos

Jigsaw-Puzzles: desde ver hasta la comprensión hasta el razonamiento en los modelos en idioma de la visión

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido