En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->dilución, difusión y simbiosis en el dilema de los prisioneros espaciales con aprendizaje de refuerzo

dilución, difusión y simbiosis en el dilema de los prisioneros espaciales con aprendizaje de refuerzo

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Estudios recientes en los Juegos de Dilema del Prisionero Espacial con el aprendizaje de refuerzo han demostrado que los agentes estáticos pueden aprender a cooperar a través de un tipo diverso de mecanismos, que incluyen inyección de ruido, diferentes tipos de algoritmos de aprendizaje y recompensa de los vecinos esta url http Este trabajo, utilizando un algoritmo independiente de aprendizaje Q de agente múltiple, estudiamos los efectos de la dilución y la movilidad en la versión espacial del dilema del prisionero. Dentro de este entorno, se definen diferentes acciones posibles para el algoritmo, que se conectan con resultados anteriores en el dilema clásico de los prisioneros espaciales de aprendizaje sin refuerzo, que muestra la versatilidad del algoritmo en el modelado de diferentes escenarios teóricos del juego y el potencial de benchmarking de este esta url http Un resultado, se observa una variedad de efectos, incluida la evidencia de que los juegos con reglas de actualización fijas pueden ser cualitativamente equivalentes a aquellos con los aprendidos, así como la aparición de un efecto mutualista simbiótico entre las poblaciones que se forma cuando se definen múltiples acciones.

Publicado Originalme en export.arxiv.org El 3 de julio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web