En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Aprender a concentrarse: MARL jerárquico sin CSI para reflectores reconfigurables

Aprender a concentrarse: MARL jerárquico sin CSI para reflectores reconfigurables

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Las superficies inteligentes reconfigurables (RIS) tienen potencial para diseñar entornos de radio inteligentes para redes de ondas milimétricas (mmWave) de próxima generación. Sin embargo, la sobrecarga computacional prohibitiva de la estimación de la información del estado del canal (CSI) y la explosión de dimensionalidad inherente a la optimización centralizada obstaculizan gravemente las implementaciones prácticas a gran escala. Para superar estos cuellos de botella, introducimos un paradigma “libre de CSI” impulsado por una arquitectura de aprendizaje por refuerzo de múltiples agentes jerárquicos (HMARL) para controlar superficies reflectantes reconfigurables mecánicamente. Al sustituir la estimación de canal basada en piloto con datos de localización de usuario accesibles, nuestro marco aprovecha la inteligencia espacial para la gestión de la propagación de ondas a escala macro. El problema de control se descompone en una arquitectura neuronal de dos niveles: un controlador de alto nivel ejecuta un usuario a reflector discreto y temporalmente extendido. asignaciones, mientras que los controladores de bajo nivel optimizan de forma autónoma los puntos focales continuos utilizando la optimización de políticas proximales de múltiples agentes (MAPPO) bajo un esquema de capacitación centralizada con ejecución descentralizada (CTDE). Las evaluaciones integrales deterministas de trazado de rayos demuestran que este marco jerárquico logra mejoras masivas de RSSI de hasta 7,79 dB sobre las líneas de base centralizadas. Además, el sistema exhibe una sólida escalabilidad multiusuario y mantiene un rendimiento de enfoque de haz altamente resistente. bajo errores prácticos de seguimiento de localización submétrica. Al eliminar la sobrecarga de CSI y al mismo tiempo mantener la redirección de la señal de alta fidelidad, este trabajo establece un modelo escalable y rentable para entornos inalámbricos inteligentes.

Publicado originalmente en export.arxiv.org el 7 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web