Impulso neurosimbólico: razonamiento fiel basado en reglas para impulsar VLA

Resumen: Impulsar modelos VLA que incorporan razonamiento de cadena de pensamiento (CoT) es atractivo porque aprovechan representaciones VLM previamente entrenadas y exponen decisiones intermedias en lenguaje natural; sin embargo, los fundamentos actuales a menudo carecen de la semántica de decisión paso a paso necesaria para mantener el fundamento causalmente conectado con el movimiento planeado. Presentamos el impulso neurosimbólico, un marco de conducción neurosimbólico que supervisa un VLA de conducción con rastros de razonamiento basado en reglas extraídos directamente de planificadores clásicos basados en reglas. Nuestra observación clave es que los planificadores basados en reglas son sistemas de IA simbólicos que ya funcionan como motores de razonamiento ejecutables: razonan sobre restricciones de seguridad activa, buscan maniobras candidatas y seleccionan una trayectoria final. Instrumentamos estos planificadores en simulación para capturar tanto la trayectoria ejecutada como el seguimiento de la decisión interna en cada paso de evaluación de reglas. Cada rastro se serializa en un razonamiento estructurado basado en reglas y se combina con la trayectoria para ajustar Qwen3.5-4B como un VLA impulsor. Debido a que estos rastros se derivan directamente de los estados del planificador que determinan la acción, garantizan que el razonamiento esté acoplado estructuralmente a la generación de movimiento mediante construcción, en lugar de mediante una alineación post hoc. En nuestro punto de referencia generado por el simulador, el razonamiento detallado basado en reglas reduce los ADE@3 de 0,47 a 0,26 y la tasa de fallos del 8,30 % al 6,40 % con percepción de tres cámaras, y de 0,54 a 0,26 y de 10,13 % a 5,99 % con percepción de ocho cámaras. El impulso neurosimbólico convierte así la lógica de planificación neurosimbólica en supervisión estructurada. Base del código: esta URL https.

Publicado originalmente en export.arxiv.org el 23 de junio de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

DART: umbral adaptativo consciente de la dificultad de entrada para DNN de salida anticipada

AI incorporada de múltiples agentes: avances y direcciones futuras

Una taxonomía de futuros omnicidas que involucran inteligencia artificial

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido