Un ajuste estrecho erosiona la alineación de seguridad en los agentes de visión y lenguaje

Resumen: Los agentes multimodales de por vida deben adaptarse continuamente a nuevas tareas mediante la capacitación posterior, pero esto crea una tensión fundamental entre adquirir capacidades y preservar la alineación de seguridad.

Leer más →

Comentarios desactivados en Un ajuste estrecho erosiona la alineación de seguridad en los agentes de visión y lenguaje

LLM-WikiRace: Evaluación comparativa de la planificación y el razonamiento a largo plazo con respecto a gráficos de conocimiento del mundo real

Resumen:Presentamos LLM-Wikirace, un punto de referencia para evaluar la planificación, el razonamiento y el conocimiento mundial en modelos de lenguajes grandes (LLM).

Leer más →

Comentarios desactivados en LLM-WikiRace: Evaluación comparativa de la planificación y el razonamiento a largo plazo con respecto a gráficos de conocimiento del mundo real

AgentLAB: Evaluación comparativa de los agentes LLM contra ataques a largo plazo

Resumen: Los agentes LLM se implementan cada vez más en entornos complejos de largo horizonte para resolver problemas desafiantes, pero esta expansión los expone a ataques de largo horizonte que explotan las interacciones usuario-agente-entorno de múltiples turnos para lograr objetivos inviables en entornos de un solo turno.

Leer más →

Comentarios desactivados en AgentLAB: Evaluación comparativa de los agentes LLM contra ataques a largo plazo

Fin del contenido

No hay más páginas por cargar