Resumen:La evaluación de modelos de lenguaje grandes requiere miles de elementos de referencia, lo que hace que las evaluaciones sean costosas y lentas. Los métodos existentes calculan la precisión promedio en conjuntos de elementos fijos, tratando todos los elementos por igual a pesar de la diferente calidad e información.
Leer más →
Resumen: La caché de valor clave (KV) es integral para la inferencia autorregresiva eficiente en modelos de lenguaje grandes (LLM), sin embargo, su crecimiento ilimitado en escenarios de múltiples turnos con estado presenta desafíos importantes.
Leer más →
Resumen: La integridad de las citas académicas enfrenta desafíos persistentes; las investigaciones indican que el 20% de las citas contienen errores y la verificación manual requiere meses de tiempo de expertos. Este artículo presenta una novedosa metodología basada en IA para una auditoría de referencias sistemática e integral utilizando IA agente con capacidades de uso de herramientas.
Leer más →