ME $^3 $ -BEV: aprendizaje de refuerzo profundo mejorado de Mamba para conducir autónomo de extremo a extremo con percepción BEV

Resumen: Los sistemas de conducción autónomos enfrentan desafíos significativos para percibir entornos complejos y tomar decisiones en tiempo real. Los enfoques modulares tradicionales, al tiempo que ofrecen interpretabilidad, sufren problemas de propagación y coordinación de errores, mientras que los sistemas de aprendizaje de extremo a extremo pueden simplificar el diseño pero enfrentar cuellos de botella computacionales. Este artículo presenta un enfoque novedoso para la conducción autónoma utilizando el aprendizaje de refuerzo profundo (DRL) que integra la percepción de la vista de los ojos de aves (BEV) para una mayor toma de decisiones en tiempo real. Presentamos el modelo Texttt {Mamba-Bev}, una red de extracción de características espacio-temporal eficiente que combina la percepción basada en BEV con el marco Mamba para el modelado de características temporales. Esta integración permite que el sistema codifique el entorno del vehículo y las características de la carretera en un sistema de coordenadas unificadas y modele con precisión las dependencias de largo alcance. Sobre la base de esto, proponemos el marco texttt {me $^3 $ -bev}, que utiliza el modelo texttt {mamba-bev} como una entrada de características para DRL de extremo a extremo, logrando un rendimiento superior en escenarios de conducción urbana dinámica. Mejoramos aún más la interpretabilidad del modelo visualizando las características de alta dimensión a través de la segmentación semántica, proporcionando información sobre las representaciones aprendidas. Experimentos extensos en el simulador Carla demuestran que Texttt {me $^3 $ -bev} superan a los modelos existentes en múltiples métricas, incluida la tasa de colisión y la precisión de la trayectoria, ofreciendo una solución prometedora para la conducción autónoma en tiempo real.

Publicado Originalme en export.arxiv.org El 10 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

ResearchRubrics: un punto de referencia de indicaciones y rúbricas para evaluar agentes de investigación profunda

Una metafísica basada en la confiabilidad de los sistemas de inteligencia artificial

Optimización de la política de la región de fideicomiso múltiple: un enfoque de restricción conjunta

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido