Resumen: Los grandes agentes basados en modelos de lenguaje han surgido recientemente como enfoques poderosos para resolver tareas dinámicas y de múltiples pasos. La mayoría de los agentes existentes emplean mecanismos de planificación para guiar acciones a largo plazo en entornos dinámicos.
Leer más →
Resumen: El LLM como juez se ha convertido en el paradigma dominante para evaluar los resultados de los modelos lingüísticos; sin embargo, los jueces del LLM exhiben sesgos sistemáticos que comprometen la confiabilidad de la evaluación.
Leer más →
Resumen: La amenaza emergente de los ataques de ingeniería social basados en AR-LLM (AR-LLM-SE) (por ejemplo, SEAR) plantea un riesgo significativo para las interacciones sociales del mundo real. En un ataque de este tipo, un actor malintencionado utiliza gafas de realidad aumentada (AR) para capturar datos visuales y vocales del objetivo.
Leer más →