Aprendizaje por refuerzo metajerárquico para la gestión de recursos escalable en O-RAN

Resumen: La creciente complejidad de las aplicaciones modernas exige redes inalámbricas capaces de adaptabilidad en tiempo real y gestión eficiente de recursos. La arquitectura Open Radio Access Network (O-RAN), con sus módulos RAN Intelligent Controller (RIC), ha surgido como una solución fundamental para la gestión dinámica de recursos y la división de redes. Si bien los métodos impulsados por la inteligencia artificial (IA) se han mostrado prometedores, la mayoría de los enfoques luchan por mantener el rendimiento en condiciones impredecibles y altamente dinámicas. Este artículo propone un marco adaptativo de aprendizaje por refuerzo metajerárquico (Meta-HRL), inspirado en el metaaprendizaje independiente del modelo (MAML), para optimizar conjuntamente la asignación de recursos y la división de la red en O-RAN. El marco integra el control jerárquico con el metaaprendizaje para permitir la adaptación tanto global como local: el controlador de alto nivel asigna recursos entre segmentos, mientras que los agentes de bajo nivel realizan la programación dentro del segmento. El mecanismo de metaactualización adaptativa pondera las tareas según la variación del error de diferencia temporal, mejorando la estabilidad y priorizando escenarios de red complejos. El análisis teórico establece garantías de convergencia sublineal y arrepentimiento para el proceso de aprendizaje de dos niveles. Los resultados de la simulación demuestran una mejora del 19,8 % en la eficiencia de la gestión de la red en comparación con los enfoques RL y meta-RL básicos, junto con una adaptación más rápida y una mayor satisfacción de QoS en los segmentos eMBB, URLLC y mMTC. Estudios adicionales de ablación y escalabilidad confirman la solidez del método, logrando una adaptación hasta un 40 % más rápida y una equidad, latencia y rendimiento consistentes a medida que aumenta la escala de la red.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Cómo IoT poderes Aplicaciones de gestión de flotas nativas: por qué el móvil nativo todavía gana

Fiabilidad del razonamiento clínico generado por modelos de lenguaje grande en tecnología de reproducción asistida: estudio de evaluación comparativa ciega

Un enfoque eficiente inspirado en insectos para la navegación visual entre puntos y objetivos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido