En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Aprendizaje por refuerzo metajerárquico para la gestión de recursos escalable en O-RAN

Aprendizaje por refuerzo metajerárquico para la gestión de recursos escalable en O-RAN

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La creciente complejidad de las aplicaciones modernas exige redes inalámbricas capaces de adaptabilidad en tiempo real y gestión eficiente de recursos. La arquitectura Open Radio Access Network (O-RAN), con sus módulos RAN Intelligent Controller (RIC), ha surgido como una solución fundamental para la gestión dinámica de recursos y la división de redes. Si bien los métodos impulsados ​​por la inteligencia artificial (IA) se han mostrado prometedores, la mayoría de los enfoques luchan por mantener el rendimiento en condiciones impredecibles y altamente dinámicas. Este artículo propone un marco adaptativo de aprendizaje por refuerzo metajerárquico (Meta-HRL), inspirado en el metaaprendizaje independiente del modelo (MAML), para optimizar conjuntamente la asignación de recursos y la división de la red en O-RAN. El marco integra el control jerárquico con el metaaprendizaje para permitir la adaptación tanto global como local: el controlador de alto nivel asigna recursos entre segmentos, mientras que los agentes de bajo nivel realizan la programación dentro del segmento. El mecanismo de metaactualización adaptativa pondera las tareas según la variación del error de diferencia temporal, mejorando la estabilidad y priorizando escenarios de red complejos. El análisis teórico establece garantías de convergencia sublineal y arrepentimiento para el proceso de aprendizaje de dos niveles. Los resultados de la simulación demuestran una mejora del 19,8 % en la eficiencia de la gestión de la red en comparación con los enfoques RL y meta-RL básicos, junto con una adaptación más rápida y una mayor satisfacción de QoS en los segmentos eMBB, URLLC y mMTC. Estudios adicionales de ablación y escalabilidad confirman la solidez del método, logrando una adaptación hasta un 40 % más rápida y una equidad, latencia y rendimiento consistentes a medida que aumenta la escala de la red.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web