Resumen: Las superficies inteligentes reconfigurables (RIS) son fundamentales para los entornos de radio inteligentes de próxima generación, pero su implementación práctica se ve gravemente obstaculizada por la intratable sobrecarga computacional de la estimación de la información del estado del canal (CSI). Para superar esta barrera fundamental de la capa física, proponemos un paradigma basado en datos, nativo de IA, que reemplaza el modelado de canales complejos con inteligencia espacial. Este artículo presenta un marco de aprendizaje por refuerzo de múltiples agentes (MARL) totalmente autónomo para controlar conjuntos de reflectores metálicos ajustables mecánicamente. Al asignar restricciones mecánicas de alta dimensión a un espacio de punto focal virtual de orden reducido, implementamos una arquitectura de capacitación centralizada con ejecución descentralizada (CTDE). Al utilizar la optimización de políticas proximales de múltiples agentes (MAPPO), nuestros agentes descentralizados aprenden estrategias cooperativas de enfoque de haz basadas en las coordenadas del usuario, logrando una operación sin CSI. Las simulaciones de trazado de rayos de alta fidelidad en entornos dinámicos sin línea de visión (NLOS) demuestran que este enfoque de múltiples agentes se adapta rápidamente a la movilidad del usuario, produciendo una mejora de hasta 26,86 dB con respecto a los reflectores planos estáticos y superando las líneas base DRL de agente único y restringidas por hardware tanto en selectividad espacial como en estabilidad temporal. Fundamentalmente, las políticas aprendidas exhiben una buena resiliencia de implementación, manteniendo una cobertura de señal estable incluso con un ruido de localización de 1,0 metro. Estos resultados validan la eficacia de las abstracciones espaciales impulsadas por MARL como una vía escalable y muy práctica hacia redes inalámbricas potenciadas por IA.
Publicado originalmente en export.arxiv.org el 7 de abril de 2026.
Ver fuente original
