Pruebas adaptativas para la evaluación de LLM: una alternativa psicométrica a los puntos de referencia estáticos

Resumen:La evaluación de modelos de lenguaje grandes requiere miles de elementos de referencia, lo que hace que las evaluaciones sean costosas y lentas. Los métodos existentes calculan la precisión promedio en conjuntos de elementos fijos, tratando todos los elementos por igual a pesar de la diferente calidad e información.

Leer más →

Comentarios desactivados en Pruebas adaptativas para la evaluación de LLM: una alternativa psicométrica a los puntos de referencia estáticos

Gestión de caché KV con estado para LLM: equilibrio de espacio, tiempo, precisión y fidelidad posicional

Resumen: La caché de valor clave (KV) es integral para la inferencia autorregresiva eficiente en modelos de lenguaje grandes (LLM), sin embargo, su crecimiento ilimitado en escenarios de múltiples turnos con estado presenta desafíos importantes.

Leer más →

Comentarios desactivados en Gestión de caché KV con estado para LLM: equilibrio de espacio, tiempo, precisión y fidelidad posicional

Auditoría de citas impulsada por IA: un protocolo de suposición cero para la verificación sistemática de referencias en la investigación académica

Resumen: La integridad de las citas académicas enfrenta desafíos persistentes; las investigaciones indican que el 20% de las citas contienen errores y la verificación manual requiere meses de tiempo de expertos. Este artículo presenta una novedosa metodología basada en IA para una auditoría de referencias sistemática e integral utilizando IA agente con capacidades de uso de herramientas.

Leer más →

Comentarios desactivados en Auditoría de citas impulsada por IA: un protocolo de suposición cero para la verificación sistemática de referencias en la investigación académica

Fin del contenido

No hay más páginas por cargar