Resumen: Los agentes de producción de LLM dependen cada vez más de la búsqueda en tiempo real, pero la búsqueda nativa agrupa la política de recuperación, la elección del proveedor, la inyección de evidencia, el costo, la latencia y el comportamiento de generación detrás de un único límite modelo-proveedor. Este acoplamiento dificulta la inspección, el ajuste, la reutilización o la portabilidad de la conexión a tierra, y puede desencadenar una verbosidad inducida por la búsqueda que infringe los estrictos contratos de salida. Presentamos Desacoplado Search Grounding (DSG), un límite independiente del proveedor que mueve la conexión a tierra fuera del modelo de razonamiento a través de una puerta de enlace compatible con MCP, exponiendo el enrutamiento del proveedor, la representación del contexto con reconocimiento de fuente, el respaldo configurado, el control de profundidad de recuperación y el almacenamiento en caché exacto y semántico como controles de primera clase. En cinco modelos de frontera en SimpleQA, FreshQA y HotpotQA, la búsqueda nativa lidera en FreshQA sensible a la actualidad, pero DSG expone una frontera más fuerte cuando el control importa: en SimpleQA casi iguala la precisión nativa (86,1 % frente a 87,7 %) con un costo de búsqueda 91 % menor, conserva contratos de respuesta concisos y alcanza una tasa de aciertos de caché caliente del 99,4 % con una latencia 68 % menor. Implementado como una capa base de producción compartida para cargas de trabajo de agencia a gran escala con modelos intercambiables, DSG iguala o supera ligeramente la precisión de la búsqueda nativa en una carga de trabajo de comprensión de consultas (QIU) de comercio electrónico y, al mismo tiempo, reduce el costo de búsqueda en más de un 98 %. La conexión a tierra en tiempo real se trata mejor como un límite de interfaz optimizable, no como una característica fija del modelo.
Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original
