En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Prune4Web: Programación de poda de árbol DOM para agente web

Prune4Web: Programación de poda de árbol DOM para agente web

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La automatización web emplea agentes inteligentes para ejecutar tareas de alto nivel imitando las interacciones humanas con las interfaces web. A pesar de las capacidades de los recientes agentes web basados ​​en Large Language Model (LLM), navegar eficientemente por páginas web complejas del mundo real sigue siendo un obstáculo importante debido al tamaño prohibitivamente grande de las estructuras del Document Object Model (DOM), que a menudo oscilan entre 10 000 y 100 000 tokens. Las estrategias existentes generalmente se basan en un crudo truncamiento del DOM (con el riesgo de perder información crítica) o emplean heurísticas ineficientes y modelos de clasificación separados, sin lograr un equilibrio óptimo entre precisión y escalabilidad. Para abordar estos desafíos, presentamos Prune4Web, un paradigma novedoso que cambia el procesamiento DOM de una lectura LLM que requiere muchos recursos a una poda programática eficiente. Un elemento central de nuestro enfoque es la programación de poda de árboles DOM, donde un LLM genera scripts de puntuación de Python ejecutables para filtrar dinámicamente elementos DOM en función de señales semánticas de subtareas descompuestas. Este mecanismo elimina la necesidad de que los LLM ingieran DOM masivos y sin procesar, en lugar de delegar el recorrido y la puntuación a programas livianos e interpretables. Esta metodología logra una reducción de 25 a 50 veces los elementos candidatos para la conexión a tierra, lo que facilita la localización precisa de la acción y mitiga la dilución de la atención. Además, proponemos un canal de anotación de datos especializado y una estrategia de capacitación en diálogo de dos turnos que optimiza conjuntamente el Planificador, el Filtro programático y el Grounder dentro de un marco unificado. Amplios experimentos demuestran un rendimiento de última generación. En particular, en nuestra tarea de conexión a tierra de bajo nivel, Prune4Web mejora drásticamente la precisión del 46,8% al 88,28%, lo que subraya su eficacia en la automatización web del mundo real.

Publicado originalmente en export.arxiv.org el 26 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web