MPR-GUI: Evaluación comparativa y mejora de la percepción y el razonamiento multilingüe en agentes GUI
Resumen:Con el avance de los recursos computacionales, los modelos de lenguaje-visión de gran tamaño (LVLM) exhiben un rendimiento impresionante de percepción y razonamiento (P&R) en tareas de interfaz gráfica de usuario (GUI).
Leer más →