Resumen: Este artículo presenta un estudio sobre el uso de diferentes algoritmos de aprendizaje de refuerzo fuera de línea para la regulación de voltaje de microrred con penetración de energía solar. Cuando la interacción del medio ambiente es inviable debido a razones técnicas o de seguridad, el enfoque propuesto aún puede obtener un modelo aplicable a través de una capacitación de estilo fuera de línea en un conjunto de datos previamente recopilado, reduciendo el impacto negativo de la falta de interacciones en el entorno en línea. Los resultados del experimento en el sistema IEEE 33-Bus demuestran la viabilidad y efectividad del enfoque propuesto en diferentes conjuntos de datos fuera de línea, incluido el que tiene una experiencia simplemente de baja calidad.
Publicado Originalme en rss.arxiv.org El 15 de mayo de 2025.
Ver Fuente Original