En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Numina: un punto de referencia de comprensión natural para la inteligencia multidimensional y las habilidades de razonamiento numérico

Numina: un punto de referencia de comprensión natural para la inteligencia multidimensional y las habilidades de razonamiento numérico

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los avances recientes en los modelos de lenguaje grande 2D (MLLMS) han mejorado significativamente el rendimiento en las tareas del idioma de la visión. Sin embargo, extender estas capacidades a entornos 3D sigue siendo un desafío distinto debido a la complejidad del razonamiento espacial. Sin embargo, los puntos de referencia 3D existentes a menudo carecen de anotaciones de tareas de razonamiento numérico de grano fino, lo que limita la capacidad de MLLM para realizar mediciones espaciales precisas y un razonamiento numérico complejo. Para abordar esta brecha, presentamos a Numina, el primer punto de referencia de comprensión natural para la inteligencia multidimensional y las habilidades de razonamiento numérico para mejorar la comprensión perceptiva interior multimodal. Numina presenta anotaciones a múltiples escala y varios pares de respuesta de preguntas, generadas usando Numina-Flow, una tubería de anotación automatizada que integra la reescritura de LLM y la autoverificación basada en reglas. Evaluamos el rendimiento de varios LLM de última generación en Numina después del marco de la escena de chat, lo que demuestra que los LLM actuales luchan con un razonamiento numérico multimodal, particularmente en la realización de cálculos precisos como la estimación de distancia y volumen, destacando la necesidad de avances adicionales en los modelos 3D. El conjunto de datos y los códigos de origen se pueden obtener de esta URL HTTPS.

Publicado Originalme en export.arxiv.org El 22 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web