De grueso a fino: planificación jerárquica autoadaptable para agentes de LLM

Resumen: Los grandes agentes basados ​​en modelos de lenguaje han surgido recientemente como enfoques poderosos para resolver tareas dinámicas y de múltiples pasos. La mayoría de los agentes existentes emplean mecanismos de planificación para guiar acciones a largo plazo en entornos dinámicos.

Leer más →

Comentarios desactivados en De grueso a fino: planificación jerárquica autoadaptable para agentes de LLM

Juzgar a los jueces: una evaluación sistemática de las estrategias de mitigación de sesgos en los procesos de LLM como juez

Resumen: El LLM como juez se ha convertido en el paradigma dominante para evaluar los resultados de los modelos lingüísticos; sin embargo, los jueces del LLM exhiben sesgos sistemáticos que comprometen la confiabilidad de la evaluación.

Leer más →

Comentarios desactivados en Juzgar a los jueces: una evaluación sistemática de las estrategias de mitigación de sesgos en los procesos de LLM como juez

PhySE: un marco psicológico para ataques de ingeniería social AR-LLM en tiempo real

Resumen: La amenaza emergente de los ataques de ingeniería social basados ​​en AR-LLM (AR-LLM-SE) (por ejemplo, SEAR) plantea un riesgo significativo para las interacciones sociales del mundo real. En un ataque de este tipo, un actor malintencionado utiliza gafas de realidad aumentada (AR) para capturar datos visuales y vocales del objetivo.

Leer más →

Comentarios desactivados en PhySE: un marco psicológico para ataques de ingeniería social AR-LLM en tiempo real

Fin del contenido

No hay más páginas por cargar