CUAAudit: Metaevaluación de modelos de visión-lenguaje como auditores de agentes autónomos de uso de computadoras

Resumen: Los agentes de uso de computadoras (CUA) están surgiendo como un nuevo paradigma en la interacción persona-computadora, permitiendo la ejecución autónoma de tareas en un entorno de escritorio mediante la percepción de instrucciones de lenguaje natural de alto nivel.

Leer más →

Comentarios desactivados en CUAAudit: Metaevaluación de modelos de visión-lenguaje como auditores de agentes autónomos de uso de computadoras

IH-Challenge: un conjunto de datos de capacitación para mejorar la jerarquía de instrucción en los LLM de Frontier

Resumen: La jerarquía de instrucciones (IH) define cómo los LLM priorizan las instrucciones del sistema, del desarrollador, del usuario y de las herramientas en caso de conflicto, proporcionando una política concreta y ordenada por confianza para resolver conflictos de instrucción.

Leer más →

Comentarios desactivados en IH-Challenge: un conjunto de datos de capacitación para mejorar la jerarquía de instrucción en los LLM de Frontier

Fin del contenido

No hay más páginas por cargar