Resumen: Los sistemas de transporte inteligente (ITS) han surgido como una solución prometedora para mejorar la congestión del tráfico urbano, con el control de la señal de tráfico (TSC) identificado como un componente crítico. Aunque los algoritmos de aprendizaje de refuerzo de múltiples agentes (MARL) han mostrado potencial para optimizar el TSC a través de la toma de decisiones en tiempo real, su escalabilidad y efectividad a menudo sufren de entornos a gran escala y complejos. Típicamente, estas limitaciones se derivan principalmente de un desajuste fundamental entre el crecimiento exponencial del espacio estatal impulsado por las heterogeneidades ambientales y la capacidad de modelado limitada de las soluciones actuales. Para abordar estos problemas, este documento presenta un nuevo marco de margas que integra redes neuronales gráficas dinámicas (DGNN) y el análisis de datos topológicos (TDA), con el objetivo de mejorar la expresividad de las representaciones ambientales y mejorar la coordinación de los agentes. Además, inspirada en la mezcla de la arquitectura de expertos (MOE) en modelos de idiomas grandes (LLM), se propone un MOE de patrón espacial asistido por topología (TSD), que aprovecha las firmas topológicas para engañar a las características gráficas para el procesamiento especializado, mejorando así la capacidad del modelo para caracterizar las observaciones dinámicas y heterogéneas locales. El módulo TSD también está integrado en las redes de política y valor del algoritmo de optimización de políticas proximales de múltiples agentes (MAPPO), mejorando aún más la eficiencia de la toma de decisiones y la robustez. Experimentos extensos realizados en escenarios de tráfico del mundo real, junto con un análisis teórico integral, validan el rendimiento superior del marco propuesto, destacando la escalabilidad y la efectividad del modelo para abordar las complejidades de las tareas de TSC a gran escala.
Publicado Originalme en rss.arxiv.org El 16 de junio de 2025.
Ver Fuente Original