Resumen: Los modelos de lenguajes grandes (LLM) a menudo tienen dificultades al realizar tareas de agencia sin un soporte sustancial de herramientas, ingeniería rápida o ajustes finos. A pesar de que las investigaciones muestran que el conocimiento procedimental dependiente del dominio puede aumentar drásticamente la eficiencia de la planificación, pocos trabajos evalúan su potencial para mejorar el desempeño del LLM en tareas de agencia que pueden requerir una planificación implícita. Formalizamos, implementamos y evaluamos un flujo de trabajo de LLM agente que aprovecha el conocimiento de procedimientos en forma de una red de tareas jerárquica (HTN). Los resultados empíricos de nuestra implementación muestran que los HTN codificados a mano pueden mejorar drásticamente el rendimiento del LLM en tareas agentes, y el uso de HTN puede impulsar un LLM de parámetros de 20b o 70b para superar un LLM de parámetros mucho mayor de 120b de referencia. Además, las HTN creadas por LLM mejoran el rendimiento general, aunque en menor medida. Los resultados sugieren que aprovechar la experiencia (de humanos, documentos o LLM) para curar el conocimiento procesal se convertirá en otra herramienta importante para mejorar los flujos de trabajo de LLM.
Publicado originalmente en export.arxiv.org el 11 de noviembre de 2025.
Ver fuente original
