Resumen: Los vehículos autónomos deben seguir siendo seguros y eficaces cuando se encuentran con escenarios raros de cola larga o intrusiones ciberfísicas durante la conducción. Presentamos RAIL, un marco humano consciente de los riesgos que convierte señales de tiempo de ejecución heterogéneas en adaptaciones de control calibradas y aprendizaje enfocado. RAIL fusiona tres señales (integridad de actuación de curvatura, proximidad de tiempo hasta la colisión y coherencia del cambio de observación) en una puntuación de riesgo de intrusión (IRS) a través de un ruido-OR ponderado. Cuando el IRS excede un umbral, las acciones se combinan con un escudo específico de señal utilizando una autoridad aprendida, mientras que la anulación humana permanece disponible; cuando el riesgo es bajo, se ejecuta la política nominal. Un bandido contextual arbitra entre escudos basándose en el vector de señal, mejorando las opciones de mitigación en línea. RAIL combina Soft Actor-Critic (SAC) con repetición priorizada por riesgo y recompensas duales para que las adquisiciones y los cuasi accidentes dirijan el aprendizaje mientras el comportamiento nominal permanece cubierto. En MetaDrive, RAIL logra un rendimiento de prueba (TR) de 360,65, una tasa de éxito de prueba (TSR) de 0,85, una infracción de seguridad de prueba (TSV) de 0,75 y una tasa de perturbación (DR) de 0,0027, mientras registra solo 29,07 violaciones de seguridad de entrenamiento, superando a RL, RL seguro, aprendizaje fuera de línea/por imitación y líneas de base HITL anteriores. Bajo inyección de red de área de controlador (CAN) y ataques de suplantación de LiDAR, mejora la tasa de éxito (SR) a 0,68 y 0,80, reduce la tasa de desconexión bajo ataque (DRA) a 0,37 y 0,03, y reduce la tasa de éxito de ataque (ASR) a 0,34 y 0,11. En CARLA, RAIL alcanza un TR de 1609,70 y un TSR de 0,41 con sólo 8000 pasos.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
