Resumen: Estudios recientes en los Juegos de Dilema del Prisionero Espacial con el aprendizaje de refuerzo han demostrado que los agentes estáticos pueden aprender a cooperar a través de un tipo diverso de mecanismos, que incluyen inyección de ruido, diferentes tipos de algoritmos de aprendizaje y recompensa de los vecinos esta url http Este trabajo, utilizando un algoritmo independiente de aprendizaje Q de agente múltiple, estudiamos los efectos de la dilución y la movilidad en la versión espacial del dilema del prisionero. Dentro de este entorno, se definen diferentes acciones posibles para el algoritmo, que se conectan con resultados anteriores en el dilema clásico de los prisioneros espaciales de aprendizaje sin refuerzo, que muestra la versatilidad del algoritmo en el modelado de diferentes escenarios teóricos del juego y el potencial de benchmarking de este esta url http Un resultado, se observa una variedad de efectos, incluida la evidencia de que los juegos con reglas de actualización fijas pueden ser cualitativamente equivalentes a aquellos con los aprendidos, así como la aparición de un efecto mutualista simbiótico entre las poblaciones que se forma cuando se definen múltiples acciones.
Publicado Originalme en export.arxiv.org El 3 de julio de 2025.
Ver Fuente Original