Resumen: Los agentes de Large Language Model (LLM) se implementan cada vez más en entornos que generan contextos masivos y dinámicos. Sin embargo, persiste un cuello de botella crítico: si bien los agentes tienen acceso a este contexto, sus indicaciones estáticas carecen de los mecanismos para gestionarlo de manera efectiva, lo que lleva a fallas recurrentes de corrección y mejora.
Leer más →
Resumen:El conjunto de datos integra 85.000 problemas AoPS seleccionados con 262.000 problemas StackExchange-Math de origen comunitario, combinando tareas de competencia estructuradas con diversas consultas matemáticas del mundo real. Realizamos evaluaciones controladas para evaluar la calidad del conjunto de datos.
Leer más →
Resumen: La síntesis de controladores es un método formal para generar automáticamente controladores de Sistema de transición etiquetado (LTS) que satisfacen propiedades específicas. Sin embargo, la eficiencia del proceso de síntesis depende críticamente de las políticas de exploración.
Leer más →