¿Cómo optimizar automáticamente las indicaciones para las tareas de dominio? Incitación y razonamiento adaptativos a través de la adaptación del conocimiento del dominio evolutivo

Resumen:Diseñar indicaciones y procesos de razonamiento óptimos para modelos de lenguaje grandes (LLM) en tareas de dominios específicos es necesario y desafiante en aplicaciones del mundo real. Determinar cómo integrar el conocimiento del dominio, mejorar la eficiencia del razonamiento e incluso proporcionar a los expertos en el dominio sugerencias refinadas para la integración del conocimiento son tareas particularmente cruciales pero aún no resueltas. En esta investigación, proponemos la optimización del gráfico evolutivo para indicaciones (EGO-Prompt), un marco automatizado para diseñar mejores indicaciones, procesos de razonamiento eficientes y proporcionar procesos mejorados con información causal. EGO-Prompt comienza con descripciones iniciales del Gráfico causal semántico (SCG), rápidas y tolerantes a fallas, construidas por expertos humanos, que luego se refinan y optimizan automáticamente para guiar el razonamiento de LLM. Al reconocer que los SCG definidos por expertos pueden ser parciales o imperfectos y que su integración óptima varía entre los LLM, EGO-Prompt integra un novedoso proceso de gradiente textual guiado causal en dos pasos: primero, generar una guía de razonamiento casi determinista del SCG para cada instancia, y segundo, adaptar el LLM para utilizar de manera efectiva la guía junto con la entrada original. El algoritmo de optimización iterativo refina aún más tanto el SCG como el mecanismo de razonamiento utilizando gradientes textuales con verdad fundamental. Probamos el marco en tareas de salud pública, transporte y comportamiento humano del mundo real. EGO-Prompt logra un F1 entre un 7,32 % y un 12,61 % más alto que los métodos de vanguardia y permite que los modelos pequeños alcancen el rendimiento de los modelos más grandes por menos del 20 % del coste original. También genera un SCG refinado y específico de dominio que mejora la interpretabilidad.

Publicado originalmente en export.arxiv.org el 26 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Manalyzer: metaanálisis automatizado de extremo a extremo con sistema de agentes múltiples

Defacto: pensamiento contrafáctico con imágenes para hacer cumplir la evidencia y el razonamiento fiel

Hacia la IA guiada por el conocimiento para el diseño inverso en la fabricación: una perspectiva sobre el dominio, la física y la sinergia humana-AI

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido