ANÁLISIS WHIF if de los modelos de idiomas grandes: explore el mundo del juego utilizando el pensamiento proactivo

Resumen: los modelos de lenguaje grande (LLMS) se destacan en el procesamiento de la información de manera reactiva, pero carecen de la capacidad de explorar sistémicamente futuros hipotéticos. No pueden preguntar: “¿Qué pasa si tomamos esta acción? ¿Cómo afectará el resultado final” y pronostican sus posibles consecuencias antes de actuar? Esta brecha crítica limita su utilidad en escenarios dinámicos y de alto riesgo como la planificación estratégica, la evaluación de riesgos y la toma de decisiones en tiempo real. Para cerrar esta brecha, proponemos WIA-LLM, un nuevo paradigma que equipa a LLM con capacidades de pensamiento proactivo. Nuestro enfoque integra el análisis de WHIF if (WIA), un enfoque sistemático para evaluar escenarios hipotéticos cambiando las variables de entrada. Al aprovechar la retroalimentación ambiental a través del aprendizaje de refuerzo, WIA-LLM va más allá del pensamiento reactivo. Simula dinámicamente los resultados de cada acción potencial, lo que permite que el modelo anticipe los estados futuros en lugar de simplemente reaccionar a las condiciones actuales. Validamos WIA-LLM en honor a Kings (HOK), un entorno de juego multijugador complejo caracterizado por cambios rápidos de estado e interacciones intrincadas. Los cambios en el estado en tiempo real del juego requieren una predicción precisa de consecuencia de varios pasos, por lo que es una prueba de prueba ideal para nuestro enfoque. Los resultados experimentales demuestran que WIA-LLM logra una notable precisión del 74.2% en el pronóstico de cambios en el estado de juego (hasta dos veces ganancias sobre las líneas de base). El modelo muestra ganancias particularmente significativas en escenarios de alta calidad donde la previsión precisa es crítica. Hasta donde sabemos, este es el primer trabajo para explorar e integrar formalmente las capacidades de análisis de lo que if dentro de LLMS. WIA-LLM representa un avance fundamental hacia el razonamiento proactivo en LLMS, proporcionando un marco escalable para la toma de decisiones sólidas en entornos dinámicos con amplias implicaciones para aplicaciones estratégicas.

Publicado Originalme en export.arxiv.org El 7 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

De Sam Ma, director ejecutivo de BEILAI

Aprendizaje de refuerzo fuera de línea para regulación de voltaje de microrred

Agentes de IA vs. AI AGENIC: una taxonomía conceptual, aplicaciones y desafío

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido