El patrón espacio-temporal asistido por la topología se desenreda para la marga escalable en control de tráfico autónomo a gran escala

Resumen: Los sistemas de transporte inteligente (ITS) han surgido como una solución prometedora para mejorar la congestión del tráfico urbano, con el control de la señal de tráfico (TSC) identificado como un componente crítico. Aunque los algoritmos de aprendizaje de refuerzo de múltiples agentes (MARL) han mostrado potencial para optimizar el TSC a través de la toma de decisiones en tiempo real, su escalabilidad y efectividad a menudo sufren de entornos a gran escala y complejos. Típicamente, estas limitaciones se derivan principalmente de un desajuste fundamental entre el crecimiento exponencial del espacio estatal impulsado por las heterogeneidades ambientales y la capacidad de modelado limitada de las soluciones actuales. Para abordar estos problemas, este documento presenta un nuevo marco de margas que integra redes neuronales gráficas dinámicas (DGNN) y el análisis de datos topológicos (TDA), con el objetivo de mejorar la expresividad de las representaciones ambientales y mejorar la coordinación de los agentes. Además, inspirada en la mezcla de la arquitectura de expertos (MOE) en modelos de idiomas grandes (LLM), se propone un MOE de patrón espacial asistido por topología (TSD), que aprovecha las firmas topológicas para engañar a las características gráficas para el procesamiento especializado, mejorando así la capacidad del modelo para caracterizar las observaciones dinámicas y heterogéneas locales. El módulo TSD también está integrado en las redes de política y valor del algoritmo de optimización de políticas proximales de múltiples agentes (MAPPO), mejorando aún más la eficiencia de la toma de decisiones y la robustez. Experimentos extensos realizados en escenarios de tráfico del mundo real, junto con un análisis teórico integral, validan el rendimiento superior del marco propuesto, destacando la escalabilidad y la efectividad del modelo para abordar las complejidades de las tareas de TSC a gran escala.

Publicado Originalme en rss.arxiv.org El 16 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Detección adaptativa de coordinación causal para redes sociales: un marco guiado por la memoria con aprendizaje semisupervisado

¿Qué limita la eficiencia de los sistemas agentes?

DrugMCTS: un marco de reutilización de drogas que combina búsqueda de árboles de múltiples agentes, trapo y Monte Carlo

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido