Resumen: Presentamos **CRYSTAL** (*__C__lear __R__easoning via __Y__ielded __S__teps, __T__raceability and __L__ogic*), un punto de referencia de diagnóstico con 6,372 instancias que evalúa el razonamiento multimodal a través de pasos intermedios verificables.
Leer más →
Resumen:Las largas conversaciones con un agente de IA crean un problema simple para un usuario: el historial es útil, pero llevarlo palabra por palabra es costoso. Estudiamos la memoria personalizada del agente: el historial de conversaciones de un usuario con un agente, destilado en una capa de recuperación compacta para una búsqueda posterior.
Leer más →
Resumen: Los sistemas multiagente (MAS) impulsados por modelos de lenguaje grande (LLM) han demostrado una gran capacidad en razonamiento complejo y uso de herramientas, y los grupos de agentes heterogéneos amplían aún más el espacio de compensación entre calidad y costo.
Leer más →