En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Gifarc: conjunto de datos sintético para aprovechar las analogías intuitivas humanas para elevar el razonamiento de AI

Gifarc: conjunto de datos sintético para aprovechar las analogías intuitivas humanas para elevar el razonamiento de AI

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El corpus de abstracción y razonamiento (ARC) plantea una prueba estricta de capacidades generales de IA, que requiere que los solucionadores infieran patrones abstractos de solo un puñado de ejemplos. A pesar del progreso sustancial en el aprendizaje profundo, los modelos de vanguardia aún logran tasas de precisión de solo 40-55% en la competencia de arco de 2024, lo que indica una brecha significativa entre su rendimiento y el razonamiento a nivel humano. En este trabajo, buscamos cerrar esa brecha introduciendo un conjunto de datos de arco inspirado en analogía, Gifarc. Aprovechando los modelos de idiomas grandes (LLM) y los modelos en idioma de visión (VLMS), sintetizamos nuevas tareas de estilo ARC de una variedad de imágenes GIF que incluyen analogías. Cada nueva tarea se combina con analogía de verdad en tierra, proporcionando un mapeo explícito entre transformaciones visuales y conceptos cotidianos. Al incorporar analogías sólidas intuitivas humanas en tareas de estilo ARC, GIFARC guía a los agentes de IA para evaluar la tarea analógicamente antes de participar en la búsqueda de patrones de fuerza bruta, reduciendo así eficientemente la complejidad de los problemas y construye una solución más concisa y inalustable humano. Validamos empíricamente que Guiding LLM con un enfoque analógico con gifarc afecta los enfoques de resolución de tareas de LLM para alinearse con el enfoque analógico de los humanos.

Publicado Originalme en rss.arxiv.org El 27 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web