Resumen: Los agentes multimodales de por vida deben adaptarse continuamente a nuevas tareas mediante la capacitación posterior, pero esto crea una tensión fundamental entre adquirir capacidades y preservar la alineación de seguridad.
Leer más →
Resumen:Presentamos LLM-Wikirace, un punto de referencia para evaluar la planificación, el razonamiento y el conocimiento mundial en modelos de lenguajes grandes (LLM).
Leer más →
Resumen: Los agentes LLM se implementan cada vez más en entornos complejos de largo horizonte para resolver problemas desafiantes, pero esta expansión los expone a ataques de largo horizonte que explotan las interacciones usuario-agente-entorno de múltiples turnos para lograr objetivos inviables en entornos de un solo turno.
Leer más →