GUI-Rise: razonamiento estructurado y resumen histórico para navegación GUI

Resumen:Si bien los modelos multimodales de lenguaje grande (MLLM) tienen agentes de navegación GUI avanzados, los enfoques actuales enfrentan limitaciones en la generalización entre dominios y la utilización efectiva del historial. Presentamos un marco de razonamiento mejorado que integra sistemáticamente razonamiento estructurado, predicción de acciones y resumen histórico.

Leer más →

Comentarios desactivados en GUI-Rise: razonamiento estructurado y resumen histórico para navegación GUI

DeepCompress: una estrategia de doble recompensa para explorar y comprimir dinámicamente cadenas de razonamiento

Resumen: Los grandes modelos de razonamiento (LRM) han demostrado capacidades impresionantes, pero adolecen de ineficiencias cognitivas como “pensar demasiado” en problemas simples y “pensar insuficientemente” en problemas complejos.

Leer más →

Comentarios desactivados en DeepCompress: una estrategia de doble recompensa para explorar y comprimir dinámicamente cadenas de razonamiento

Enmascaramiento causal en datos espaciales: un caso teórico de la información para aprender conjuntos de datos espaciales con modelos de lenguaje unimodales

Resumen: Los modelos de lenguaje se diseñan tradicionalmente en torno a un enmascaramiento causal. En dominios con estructura espacial o relacional, el enmascaramiento causal a menudo se considera inapropiado y, en su lugar, se utilizan linealizaciones secuenciales.

Leer más →

Comentarios desactivados en Enmascaramiento causal en datos espaciales: un caso teórico de la información para aprender conjuntos de datos espaciales con modelos de lenguaje unimodales

Fin del contenido

No hay más páginas por cargar