En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Transferencia de modelos de acción-idioma de visión a aplicaciones de la industria: arquitecturas, rendimiento y desafíos

Transferencia de modelos de acción-idioma de visión a aplicaciones de la industria: arquitecturas, rendimiento y desafíos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La aplicación de la inteligencia artificial (IA) en la industria está acelerando el cambio de la automatización tradicional a los sistemas inteligentes con percepción y cognición. Los modelos de Acción de Lengua Vision (VLA) han sido un paradigma clave en IA para unificar la percepción, el razonamiento y el control. ¿El rendimiento de los modelos VLA ha cumplido con los requisitos industriales? En este documento, desde la perspectiva de la implementación industrial, comparamos el desempeño de los modelos VLA de última generación existentes en escenarios industriales y analizamos las limitaciones de los modelos VLA para la implementación industrial del mundo real desde las perspectivas de recopilación de datos y arquitectura de modelos. Los resultados muestran que los modelos VLA conservan su capacidad para realizar tareas simples de comprensión incluso en entornos industriales después del ajuste. Sin embargo, hay mucho espacio para la mejora del rendimiento en entornos industriales complejos, diversas categorías de objetos y tareas de colocación de alta precisión. Nuestros hallazgos proporcionan una visión práctica de la adaptabilidad de los modelos VLA para uso industrial y resaltan la necesidad de mejoras específicas de tareas para mejorar su robustez, generalización y precisión.

Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web