SemanticALLI: almacenamiento en caché del razonamiento, no solo de las respuestas, en sistemas agentes

Resumen:Presentamos SemanticALLI, una arquitectura con reconocimiento de canalizaciones dentro de Alli (la plataforma de inteligencia de marketing de PMG), diseñada para poner en práctica el razonamiento redundante. Al descomponer la generación en resolución de intención analítica (AIR) y síntesis de visualización (VS), SemanticALLI eleva las representaciones intermedias estructuradas (IR) a artefactos almacenables en caché de primera clase.
El impacto del almacenamiento en caché dentro del bucle agente es sustancial. En nuestra evaluación, el almacenamiento en caché monolítico de referencia tiene un límite de acierto del 38,7 % debido a la variación lingüística. Por el contrario, nuestro enfoque estructurado permite una etapa adicional, la etapa de Síntesis de Visualización, para lograr una tasa de acierto del 83,10 %, evitando 4023 llamadas de LLM con una latencia media de solo 2,66 ms. Esta reutilización interna reduce el consumo total de tokens, lo que ofrece una lección práctica para el diseño de sistemas de IA: incluso cuando los usuarios rara vez repiten lo que dicen, la canalización a menudo lo hace, en puntos de control estables y estructurados donde el almacenamiento en caché es más confiable.

Publicado originalmente en export.arxiv.org el 25 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Jugando con el juez: una cadena de pensamiento infiel puede socavar la evaluación del agente

deslumbrado

Aprovechamiento de los LLM para la extracción de datos estructurados de registros de pacientes no estructurados

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido