Resumen: WebSight-7b logra una precisión de Top-1 de 58.84% en el punto de referencia de clics de enfrentamiento, superando a varios modelos generalistas más grandes mientras mantiene una menor latencia. El agente de Websight completo logra una tasa de éxito del 68.0%en el punto de referencia de WebVoyager, superando los sistemas de laboratorios como OpenAI (61.0%) y HCompany (Runner H, 67.0%). Entre las tareas completadas, WebSight responde correctamente el 97.14% del tiempo, lo que indica una alta precisión. Juntos, WebSight y WebSight-7b establecen un nuevo estándar para la navegación web visual interpretable, robusta y eficiente.
Publicado Originalme en export.arxiv.org El 25 de agosto de 2025.
Ver Fuente Original
