Resumen: Los modelos de lenguaje grande (LLM) han demostrado capacidades notables en tareas de razonamiento complejas cuando están equipados con herramientas externas. Sin embargo, los marcos actuales dependen predominantemente del procesamiento secuencial, lo que lleva a una ejecución ineficiente, particularmente para tareas que requieren una interacción de herramienta extensa. Este documento presenta Flash-Searcher, un nuevo marco de razonamiento de agente paralelo que reinventa fundamentalmente el paradigma de ejecución de las cadenas secuenciales a los gráficos acíclicos dirigidos (DAG). El búsqueda de flash descompone tareas complejas en subtareas con dependencias explícitas, lo que permite la ejecución concurrente de rutas de razonamiento independientes mientras mantiene restricciones lógicas. A través de la optimización dinámica del flujo de trabajo, nuestro marco refina continuamente el gráfico de ejecución en función de los resultados intermedios, integrando efectivamente el módulo de resumen. Las evaluaciones integrales en múltiples puntos de referencia demuestran que Flash-Searcher supera constantemente los enfoques existentes. Específicamente, logra una precisión del 67.7% en Browsecomp y 83% en XBench-DeepSearch, al tiempo que reduce los pasos de ejecución del agente hasta un 35% en comparación con los marcos actuales. Además, al destilar esta tubería de razonamiento paralelo en modelos individuales, observamos ganancias de rendimiento sustanciales en diversas arquitecturas de columna vertebral, lo que subraya la generalización de nuestra metodología. Por lo tanto, nuestro trabajo representa un avance significativo en el diseño de la arquitectura de agentes, que ofrece un paradigma más escalable y eficiente para tareas de razonamiento complejos.
Publicado Originalme en export.arxiv.org El 30 de septiembre de 2025.
Ver Fuente Original