Resumen: Los agentes encarnados en un mundo abierto deben resolver tareas de largo plazo donde el principal cuello de botella no es la calidad de la planificación de un solo paso, sino cómo se organiza y evoluciona la experiencia de interacción.
Leer más →
Resumen: Presentamos **CRYSTAL** (*__C__lear __R__easoning via __Y__ielded __S__teps, __T__raceability and __L__ogic*), un punto de referencia de diagnóstico con 6,372 instancias que evalúa el razonamiento multimodal a través de pasos intermedios verificables.
Leer más →
Resumen:Las largas conversaciones con un agente de IA crean un problema simple para un usuario: el historial es útil, pero llevarlo palabra por palabra es costoso. Estudiamos la memoria personalizada del agente: el historial de conversaciones de un usuario con un agente, destilado en una capa de recuperación compacta para una búsqueda posterior.
Leer más →