En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->SemanticALLI: almacenamiento en caché del razonamiento, no solo de las respuestas, en sistemas agentes

SemanticALLI: almacenamiento en caché del razonamiento, no solo de las respuestas, en sistemas agentes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Presentamos SemanticALLI, una arquitectura con reconocimiento de canalizaciones dentro de Alli (la plataforma de inteligencia de marketing de PMG), diseñada para poner en práctica el razonamiento redundante. Al descomponer la generación en resolución de intención analítica (AIR) y síntesis de visualización (VS), SemanticALLI eleva las representaciones intermedias estructuradas (IR) a artefactos almacenables en caché de primera clase.
El impacto del almacenamiento en caché dentro del bucle agente es sustancial. En nuestra evaluación, el almacenamiento en caché monolítico de referencia tiene un límite de acierto del 38,7 % debido a la variación lingüística. Por el contrario, nuestro enfoque estructurado permite una etapa adicional, la etapa de Síntesis de Visualización, para lograr una tasa de acierto del 83,10 %, evitando 4023 llamadas de LLM con una latencia media de solo 2,66 ms. Esta reutilización interna reduce el consumo total de tokens, lo que ofrece una lección práctica para el diseño de sistemas de IA: incluso cuando los usuarios rara vez repiten lo que dicen, la canalización a menudo lo hace, en puntos de control estables y estructurados donde el almacenamiento en caché es más confiable.

Publicado originalmente en export.arxiv.org el 25 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web