Resumen: La serie de pruebas comparativas ARC-AGI sirve como una medida crítica de generalización de pocas tomas en tareas novedosas, un aspecto central de la inteligencia. La competencia global ARC Prize 2025 se centró en el conjunto de datos ARC-AGI-2 recientemente lanzado, que presenta una mayor complejidad de tareas en comparación con su predecesor. La competencia de Kaggle atrajo a 1.455 equipos y 15.154 inscripciones, y la puntuación máxima alcanzó el 24 % en el conjunto de evaluación privada ARC-AGI-2. Las presentaciones de artículos casi se duplicaron año tras año a 90 entradas, lo que refleja el creciente interés de la investigación en la inteligencia fluida y el razonamiento abstracto. El tema definitorio de 2025 es el surgimiento del ciclo de refinamiento: un ciclo de optimización de programas iterativo por tarea guiado por una señal de retroalimentación. Los bucles de refinamiento se presentan en una variedad de formas, en particular enfoques de síntesis de programas evolutivos y refinamientos de la capa de aplicación para sistemas comerciales de IA. Estos bucles de refinamiento también son posibles en el espacio de peso, como lo demuestran los métodos de aprendizaje profundo sin preentrenamiento que ahora están logrando un rendimiento competitivo con redes notablemente pequeñas (parámetros 7M). Paralelamente, cuatro laboratorios de IA de vanguardia (Anthropic, Google DeepMind, OpenAI y xAI) informaron el rendimiento de ARC-AGI en tarjetas modelo públicas en 2025, estableciendo ARC-AGI como un punto de referencia estándar de la industria para el razonamiento de IA. Sin embargo, nuestro análisis indica que el rendimiento actual del razonamiento de la IA en la frontera sigue estando fundamentalmente limitado a la cobertura del conocimiento, lo que da lugar a nuevas formas de contaminación de los puntos de referencia. En este artículo, analizamos los métodos de mayor rendimiento, examinamos el papel de los bucles de refinamiento en el progreso de AGI, analizamos el sobreajuste dependiente del conocimiento y presentamos una vista previa de ARC-AGI-3, que introduce desafíos de razonamiento interactivo que requieren capacidades de exploración, planificación, memoria, adquisición de objetivos y alineación.
Publicado originalmente en export.arxiv.org el 18 de enero de 2026.
Ver fuente original
