Superar pujas y faroles a los humanos de élite: dominar el póquer mentiroso mediante el autojuego y el aprendizaje por refuerzo

Resumen: Los investigadores de IA se han centrado durante mucho tiempo en juegos similares al póquer como banco de pruebas para entornos caracterizados por dinámicas multijugador, información imperfecta y razonamiento en condiciones de incertidumbre. Si bien los avances recientes han igualado el juego humano de élite en Texas Hold’em sin límite, la dinámica multijugador es moderada: la mayoría de las manos convergen rápidamente con sólo dos jugadores involucrados en múltiples rondas de subasta. En este artículo, presentamos a Solly, el primer agente de IA que logró el juego humano de élite en Liar’s Poker de formato reducido, un juego caracterizado por una amplia participación multijugador. Entrenamos a Solly usando el juego autónomo con un algoritmo de aprendizaje de refuerzo profundo, crítico de actor y sin modelos. Solly jugó a un nivel humano de élite medido por la tasa de victorias (ganó más del 50% de las manos) y la equidad (dinero ganado) en Liar’s Poker mano a mano y multijugador. Solly también superó a los modelos de lenguajes grandes (LLM), incluidos aquellos con capacidad de razonamiento, en las mismas métricas. Solly desarrolló estrategias de oferta novedosas, aleatorizó el juego de manera efectiva y no fue fácilmente explotable por jugadores humanos de clase mundial.

Publicado originalmente en export.arxiv.org el 5 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Investigación del desarrollo de la comunicación orientada a tareas en modelos visión-lenguaje

Sonic fortalece la colaboración global con siete nuevos miembros y expande presencia en Open Source Summit Europe 2025

BeSTAD: Detección de anomalías espacio-temporales consciente del comportamiento para datos de movilidad humana

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido