En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->ME $^3 $ -BEV: aprendizaje de refuerzo profundo mejorado de Mamba para conducir autónomo de extremo a extremo con percepción BEV

ME $^3 $ -BEV: aprendizaje de refuerzo profundo mejorado de Mamba para conducir autónomo de extremo a extremo con percepción BEV

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de conducción autónomos enfrentan desafíos significativos para percibir entornos complejos y tomar decisiones en tiempo real. Los enfoques modulares tradicionales, al tiempo que ofrecen interpretabilidad, sufren problemas de propagación y coordinación de errores, mientras que los sistemas de aprendizaje de extremo a extremo pueden simplificar el diseño pero enfrentar cuellos de botella computacionales. Este artículo presenta un enfoque novedoso para la conducción autónoma utilizando el aprendizaje de refuerzo profundo (DRL) que integra la percepción de la vista de los ojos de aves (BEV) para una mayor toma de decisiones en tiempo real. Presentamos el modelo Texttt {Mamba-Bev}, una red de extracción de características espacio-temporal eficiente que combina la percepción basada en BEV con el marco Mamba para el modelado de características temporales. Esta integración permite que el sistema codifique el entorno del vehículo y las características de la carretera en un sistema de coordenadas unificadas y modele con precisión las dependencias de largo alcance. Sobre la base de esto, proponemos el marco texttt {me $^3 $ -bev}, que utiliza el modelo texttt {mamba-bev} como una entrada de características para DRL de extremo a extremo, logrando un rendimiento superior en escenarios de conducción urbana dinámica. Mejoramos aún más la interpretabilidad del modelo visualizando las características de alta dimensión a través de la segmentación semántica, proporcionando información sobre las representaciones aprendidas. Experimentos extensos en el simulador Carla demuestran que Texttt {me $^3 $ -bev} superan a los modelos existentes en múltiples métricas, incluida la tasa de colisión y la precisión de la trayectoria, ofreciendo una solución prometedora para la conducción autónoma en tiempo real.

Publicado Originalme en export.arxiv.org El 10 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web