En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Aprendizaje de refuerzo de múltiples agentes para observación autónoma de tierra multisatélite: un estudio de caso realista

Aprendizaje de refuerzo de múltiples agentes para observación autónoma de tierra multisatélite: un estudio de caso realista

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El crecimiento exponencial de los satélites de órbita terrestre baja (LEO) ha revolucionado misiones de observación de la Tierra (EO), abordando los desafíos en el monitoreo climático, la gestión de desastres y más. Sin embargo, la coordinación autónoma en los sistemas de múltiples satélites sigue siendo un desafío fundamental. Los enfoques de optimización tradicionales luchan para manejar las demandas de toma de decisiones en tiempo real de misiones Dinamic EO, que requieren el uso del aprendizaje de refuerzo (RL) y el aprendizaje de refuerzo de múltiples agentes (MARL). En este documento, investigamos la planificación de misiones EO autónoma basada en RL modelando operaciones de un solo satélite y extendiéndose a constelaciones de múltiples satélites utilizando marcos Marl. Abordamos desafíos clave, incluidas las limitaciones de almacenamiento de energía y datos, incertidumbres en las observaciones satelitales y las complejidades de la coordinación descentralizada bajo observabilidad parcial. Al aprovechar un entorno de simulación satelital casi realista, evaluamos la estabilidad de la capacitación y el rendimiento de los algoritmos de marga de última generación, incluidos PPO, IPPO, MAPPO y HAPPO. Nuestros resultados demuestran que Marl puede equilibrar efectivamente las imágenes y la gestión de recursos al tiempo que aborda la no estacionaridad y recompensa la interdependencia en la coordinación multisatélite. Las ideas obtenidas de este estudio proporcionan una base para las operaciones satelitales autónomas, que ofrecen pautas prácticas para mejorar el aprendizaje de políticas en misiones EO descentralizadas.

Publicado Originalme en rss.arxiv.org El 18 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web