BeSafe-Bench: Revelando los riesgos de seguridad conductual de agentes situados en entornos funcionales
Resumen:La rápida evolución de los grandes modelos multimodales (LMM) ha permitido a los agentes realizar tareas físicas y digitales complejas, sin embargo, su implementación como tomadores de decisiones autónomos introduce importantes riesgos de seguridad conductuales no intencionales.
Leer más →