En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Superar pujas y faroles a los humanos de élite: dominar el póquer mentiroso mediante el autojuego y el aprendizaje por refuerzo

Superar pujas y faroles a los humanos de élite: dominar el póquer mentiroso mediante el autojuego y el aprendizaje por refuerzo

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los investigadores de IA se han centrado durante mucho tiempo en juegos similares al póquer como banco de pruebas para entornos caracterizados por dinámicas multijugador, información imperfecta y razonamiento en condiciones de incertidumbre. Si bien los avances recientes han igualado el juego humano de élite en Texas Hold’em sin límite, la dinámica multijugador es moderada: la mayoría de las manos convergen rápidamente con sólo dos jugadores involucrados en múltiples rondas de subasta. En este artículo, presentamos a Solly, el primer agente de IA que logró el juego humano de élite en Liar’s Poker de formato reducido, un juego caracterizado por una amplia participación multijugador. Entrenamos a Solly usando el juego autónomo con un algoritmo de aprendizaje de refuerzo profundo, crítico de actor y sin modelos. Solly jugó a un nivel humano de élite medido por la tasa de victorias (ganó más del 50% de las manos) y la equidad (dinero ganado) en Liar’s Poker mano a mano y multijugador. Solly también superó a los modelos de lenguajes grandes (LLM), incluidos aquellos con capacidad de razonamiento, en las mismas métricas. Solly desarrolló estrategias de oferta novedosas, aleatorizó el juego de manera efectiva y no fue fácilmente explotable por jugadores humanos de clase mundial.

Publicado originalmente en export.arxiv.org el 5 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web