En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Impulso neurosimbólico: razonamiento fiel basado en reglas para impulsar VLA

Impulso neurosimbólico: razonamiento fiel basado en reglas para impulsar VLA

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Impulsar modelos VLA que incorporan razonamiento de cadena de pensamiento (CoT) es atractivo porque aprovechan representaciones VLM previamente entrenadas y exponen decisiones intermedias en lenguaje natural; sin embargo, los fundamentos actuales a menudo carecen de la semántica de decisión paso a paso necesaria para mantener el fundamento causalmente conectado con el movimiento planeado. Presentamos el impulso neurosimbólico, un marco de conducción neurosimbólico que supervisa un VLA de conducción con rastros de razonamiento basado en reglas extraídos directamente de planificadores clásicos basados ​​en reglas. Nuestra observación clave es que los planificadores basados ​​en reglas son sistemas de IA simbólicos que ya funcionan como motores de razonamiento ejecutables: razonan sobre restricciones de seguridad activa, buscan maniobras candidatas y seleccionan una trayectoria final. Instrumentamos estos planificadores en simulación para capturar tanto la trayectoria ejecutada como el seguimiento de la decisión interna en cada paso de evaluación de reglas. Cada rastro se serializa en un razonamiento estructurado basado en reglas y se combina con la trayectoria para ajustar Qwen3.5-4B como un VLA impulsor. Debido a que estos rastros se derivan directamente de los estados del planificador que determinan la acción, garantizan que el razonamiento esté acoplado estructuralmente a la generación de movimiento mediante construcción, en lugar de mediante una alineación post hoc. En nuestro punto de referencia generado por el simulador, el razonamiento detallado basado en reglas reduce los ADE@3 de 0,47 a 0,26 y la tasa de fallos del 8,30 % al 6,40 % con percepción de tres cámaras, y de 0,54 a 0,26 y de 10,13 % a 5,99 % con percepción de ocho cámaras. El impulso neurosimbólico convierte así la lógica de planificación neurosimbólica en supervisión estructurada. Base del código: esta URL https.

Publicado originalmente en export.arxiv.org el 23 de junio de 2026.
Ver fuente original

admin

Usuario de administración del sitio web