ALCANCE: Evolución rápida para mejorar la eficacia del agente

Resumen: Los agentes de Large Language Model (LLM) se implementan cada vez más en entornos que generan contextos masivos y dinámicos. Sin embargo, persiste un cuello de botella crítico: si bien los agentes tienen acceso a este contexto, sus indicaciones estáticas carecen de los mecanismos para gestionarlo de manera efectiva, lo que lleva a fallas recurrentes de corrección y mejora.

Leer más →

Comentarios desactivados en ALCANCE: Evolución rápida para mejorar la eficacia del agente

Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Resumen:El conjunto de datos integra 85.000 problemas AoPS seleccionados con 262.000 problemas StackExchange-Math de origen comunitario, combinando tareas de competencia estructuradas con diversas consultas matemáticas del mundo real. Realizamos evaluaciones controladas para evaluar la calidad del conjunto de datos.

Leer más →

Comentarios desactivados en Nemotron-Math: destilación eficiente de razonamiento matemático en contexto largo a partir de supervisión multimodo

Razonamiento espacial bilateral sobre redes de calles: RAG basado en gráficos con representaciones espaciales cualitativas

Resumen: Este artículo trata de mejorar las capacidades de los modelos de lenguaje grande (LLM) para proporcionar instrucciones de ruta para peatones mediante relaciones espaciales cualitativas.

Publicado originalmente en export.arxiv.org el 18 de diciembre de 2025.

Leer más →

Comentarios desactivados en Razonamiento espacial bilateral sobre redes de calles: RAG basado en gráficos con representaciones espaciales cualitativas

Fin del contenido

No hay más páginas por cargar