El problema del cambio de distribución en las redes de transporte utilizando el aprendizaje de refuerzo y la IA

Resumen: El uso del aprendizaje automático (ML) y la inteligencia artificial (IA) en las redes de transporte inteligente han aumentado significativamente en los últimos años. Entre estos enfoques de ML y AI, se ha demostrado que el aprendizaje de refuerzo (RL) es un enfoque muy prometedor por varios autores. Sin embargo, un problema con el uso de aprendizaje de refuerzo en el control de la señal de tráfico es la confiabilidad de los agentes RL capacitados debido a la distribución dinámica que cambia los datos de entrada con respecto a la distribución de los datos utilizados para la capacitación. Esto presenta un gran desafío y un problema de confiabilidad para la red capacitada de agentes de IA y podría tener consecuencias muy indeseables e incluso perjudiciales si no se encuentra una solución adecuada. Varios investigadores han tratado de abordar este problema utilizando diferentes enfoques. En particular, el aprendizaje de meta refuerzo (meta rl) promete ser una solución efectiva. En este documento, evaluamos y analizamos un enfoque meta de vanguardia llamado Metalight y mostramos que, si bien Metalight puede conducir a resultados razonablemente buenos, bajo otras condiciones, podría no funcionar bien (con errores de hasta el 22%), lo que sugiere que los esquemas meta a menudo no son lo suficientemente sólidos e incluso pueden explicar problemas de confiabilidad importantes.

Publicado Originalme en export.arxiv.org El 21 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Su reloj algún día controlará la presión arterial

RLHF-V generativo: principios de aprendizaje de preferencia humana multimodal

Grupos de certificación europea de ciberseguridad Grupo sobre criptografía Mecanismos criptográficos acordados

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido