En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Websight: una arquitectura de visión para agentes web robustos

Websight: una arquitectura de visión para agentes web robustos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: WebSight-7b logra una precisión de Top-1 de 58.84% en el punto de referencia de clics de enfrentamiento, superando a varios modelos generalistas más grandes mientras mantiene una menor latencia. El agente de Websight completo logra una tasa de éxito del 68.0%en el punto de referencia de WebVoyager, superando los sistemas de laboratorios como OpenAI (61.0%) y HCompany (Runner H, 67.0%). Entre las tareas completadas, WebSight responde correctamente el 97.14% del tiempo, lo que indica una alta precisión. Juntos, WebSight y WebSight-7b establecen un nuevo estándar para la navegación web visual interpretable, robusta y eficiente.

Publicado Originalme en export.arxiv.org El 25 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web