Resumen: Los investigadores de IA se han centrado durante mucho tiempo en juegos similares al póquer como banco de pruebas para entornos caracterizados por dinámicas multijugador, información imperfecta y razonamiento en condiciones de incertidumbre. Si bien los avances recientes han igualado el juego humano de élite en Texas Hold’em sin límite, la dinámica multijugador es moderada: la mayoría de las manos convergen rápidamente con sólo dos jugadores involucrados en múltiples rondas de subasta. En este artículo, presentamos a Solly, el primer agente de IA que logró el juego humano de élite en Liar’s Poker de formato reducido, un juego caracterizado por una amplia participación multijugador. Entrenamos a Solly usando el juego autónomo con un algoritmo de aprendizaje de refuerzo profundo, crítico de actor y sin modelos. Solly jugó a un nivel humano de élite medido por la tasa de victorias (ganó más del 50% de las manos) y la equidad (dinero ganado) en Liar’s Poker mano a mano y multijugador. Solly también superó a los modelos de lenguajes grandes (LLM), incluidos aquellos con capacidad de razonamiento, en las mismas métricas. Solly desarrolló estrategias de oferta novedosas, aleatorizó el juego de manera efectiva y no fue fácilmente explotable por jugadores humanos de clase mundial.
Publicado originalmente en export.arxiv.org el 5 de noviembre de 2025.
Ver fuente original
