En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->El problema del cambio de distribución en las redes de transporte utilizando el aprendizaje de refuerzo y la IA

El problema del cambio de distribución en las redes de transporte utilizando el aprendizaje de refuerzo y la IA

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El uso del aprendizaje automático (ML) y la inteligencia artificial (IA) en las redes de transporte inteligente han aumentado significativamente en los últimos años. Entre estos enfoques de ML y AI, se ha demostrado que el aprendizaje de refuerzo (RL) es un enfoque muy prometedor por varios autores. Sin embargo, un problema con el uso de aprendizaje de refuerzo en el control de la señal de tráfico es la confiabilidad de los agentes RL capacitados debido a la distribución dinámica que cambia los datos de entrada con respecto a la distribución de los datos utilizados para la capacitación. Esto presenta un gran desafío y un problema de confiabilidad para la red capacitada de agentes de IA y podría tener consecuencias muy indeseables e incluso perjudiciales si no se encuentra una solución adecuada. Varios investigadores han tratado de abordar este problema utilizando diferentes enfoques. En particular, el aprendizaje de meta refuerzo (meta rl) promete ser una solución efectiva. En este documento, evaluamos y analizamos un enfoque meta de vanguardia llamado Metalight y mostramos que, si bien Metalight puede conducir a resultados razonablemente buenos, bajo otras condiciones, podría no funcionar bien (con errores de hasta el 22%), lo que sugiere que los esquemas meta a menudo no son lo suficientemente sólidos e incluso pueden explicar problemas de confiabilidad importantes.

Publicado Originalme en export.arxiv.org El 21 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web