En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->EdgeNav-QE: Cuantización QLoRA y salida temprana dinámica para navegación basada en LAM en dispositivos Edge

EdgeNav-QE: Cuantización QLoRA y salida temprana dinámica para navegación basada en LAM en dispositivos Edge

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de acción de gran tamaño (LAM) han demostrado un inmenso potencial en la navegación autónoma al unir el razonamiento de alto nivel con el control de bajo nivel. Sin embargo, implementar estos modelos de parámetros multimillonarios en dispositivos perimetrales sigue siendo un desafío importante debido a las limitaciones de memoria y los requisitos de latencia. En este artículo, proponemos EdgeNav-QE, un marco novedoso que integra la adaptación cuantificada de bajo rango (QLoRA) con un mecanismo dinámico de salida temprana (DEE) para optimizar los LAM para la navegación perimetral en tiempo real. Al cuantificar la columna vertebral con una precisión de 4 bits y colocar estratégicamente ramas de salida temprana, permitimos que el modelo termine la inferencia tempranamente para tareas de navegación simples y, al mismo tiempo, conserva la profundidad total para la toma de decisiones complejas. Los resultados experimentales en el entorno Habitat-Sim con el conjunto de datos Matterport3D utilizando la red troncal OpenVLA-7B demuestran que EdgeNav-QE reduce la latencia de inferencia en un 82,7 % y la huella de memoria en un 66,7 % en comparación con las líneas base de precisión total, al tiempo que mantiene una tasa de éxito de navegación del 81,8 %. Además, supera al método estático de salida temprana de última generación en un 17,9 % en latencia, lo que demuestra la superioridad de la computación adaptativa consciente del contenido para aplicaciones críticas para la seguridad.

Publicado originalmente en export.arxiv.org el 18 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web