En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Marco de decisión de ajedrez de Amazon con recursos limitados que integra grandes modelos de lenguaje y atención de gráficos

Marco de decisión de ajedrez de Amazon con recursos limitados que integra grandes modelos de lenguaje y atención de gráficos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La inteligencia artificial ha avanzado significativamente a través del desarrollo de sistemas de juego inteligentes, proporcionando bancos de pruebas rigurosos para la toma de decisiones, la planificación estratégica y el aprendizaje adaptativo. Sin embargo, los entornos con recursos limitados plantean desafíos críticos, ya que los métodos convencionales de aprendizaje profundo dependen en gran medida de extensos conjuntos de datos y recursos computacionales. En este artículo, proponemos un marco híbrido liviano para el Juego de las Amazonas, que explora el paradigma de la generalización de débil a fuerte integrando el razonamiento estructural del aprendizaje basado en gráficos con las capacidades generativas de grandes modelos de lenguaje. Específicamente, aprovechamos un codificador automático de atención gráfica para informar una búsqueda de árbol Monte Carlo de varios pasos, utilizamos un algoritmo genético de gráfico estocástico para optimizar las señales de evaluación y aprovechamos GPT-4o-mini para generar datos de entrenamiento sintéticos. A diferencia de los enfoques tradicionales que se basan en demostraciones de expertos, nuestro marco aprende de una supervisión ruidosa e imperfecta. Demostramos que el mecanismo Graph Attention funciona efectivamente como un filtro estructural, eliminando el ruido de las salidas del LLM. Los experimentos en una placa Amazons de 10$times$10 muestran que nuestro enfoque híbrido no solo logra una mejora del 15%–56% en la precisión de las decisiones con respecto a las líneas de base, sino que también supera significativamente a su modelo docente (GPT-4o-mini), logrando una tasa de ganancia competitiva del 45,0% en N=30 nodos y un decisivo 66,5% en solo N=50 nodos. Estos resultados verifican la viabilidad de desarrollar una IA de juegos especializada y de alto rendimiento a partir de modelos básicos de propósito general bajo estrictas restricciones computacionales.

Publicado originalmente en export.arxiv.org el 11 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web