Uso de modelos de lenguaje grandes para la abstracción de dominios de planificación: versión extendida

Resumen: Generar una abstracción de un dominio dinámico que se alinee con un propósito determinado sigue siendo un desafío importante dado que la elección de dicha abstracción puede afectar la capacidad de un agente para planificar, razonar y proporcionar explicaciones de manera efectiva. Modelamos los comportamientos concretos del agente en PDDL e investigamos el uso del aprendizaje en contexto con modelos de lenguaje grandes (LLM) para la generación de dominios PDDL abstractos e instancias de problemas, dado un objetivo de abstracción especificado en lenguaje natural. Los ejemplos de referencia que utilizamos son nuevos y no han formado parte de los datos en los que se ha capacitado a ningún LLM. Consideramos tres categorías de abstracciones: abstracción de elección de acciones concretas alternativas, abstracción de secuencias de acciones concretas y abstracción de parámetros de acción/predicado, así como combinaciones de estos. Los dominios PDDL abstractos generados y las instancias de problemas luego se verifican mediante herramientas de validación simbólica y expertos humanos. Nuestros experimentos muestran que GPT-4o generalmente puede sintetizar abstracciones útiles del dominio de planificación en entornos simples, aunque es mejor para abstraer acciones que los flujos asociados.

Publicado originalmente en export.arxiv.org el 23 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Tomar Goodhart en serio: Límite de principios en la optimización de IA de uso general

Boletín AIOTI Septiembre 2025

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido