En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->El problema del juego oculto

El problema del juego oculto

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Este artículo investiga una clase de juegos con grandes espacios de estrategia, motivados por desafíos en la alineación de la IA y los juegos de lenguaje. Introducimos el problema oculto del juego, donde para cada jugador, un subconjunto desconocido de estrategias produce consistentemente recompensas más altas en comparación con el resto. La pregunta central es si se pueden diseñar algoritmos eficientes de minimización del arrepentimiento para descubrir y explotar tales estructuras ocultas, llevando al equilibrio en estos subjuegos manteniendo al mismo tiempo la racionalidad en general. Respondemos afirmativamente a esta pregunta desarrollando una composición de técnicas de minimización del arrepentimiento que logran límites óptimos de arrepentimiento externo y de intercambio. Nuestro enfoque garantiza una rápida convergencia hacia equilibrios correlacionados en subjuegos ocultos, aprovechando la estructura del juego oculto para mejorar la eficiencia computacional.

Publicado originalmente en export.arxiv.org el 6 de octubre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web