Observatorio de información y Publicaciones | Página 33 de 897 | Asociación Mexicana del Internet de las Cosas A.C.

Pruebas adaptativas para la evaluación de LLM: una alternativa psicométrica a los puntos de referencia estáticos

Resumen:La evaluación de modelos de lenguaje grandes requiere miles de elementos de referencia, lo que hace que las evaluaciones sean costosas y lentas. Los métodos existentes calculan la precisión promedio en conjuntos de elementos fijos, tratando todos los elementos por igual a pesar de la diferente calidad e información.

Leer más →

Comentarios desactivados

9 noviembre, 2025

Noticias externas

Gestión de caché KV con estado para LLM: equilibrio de espacio, tiempo, precisión y fidelidad posicional

Resumen: La caché de valor clave (KV) es integral para la inferencia autorregresiva eficiente en modelos de lenguaje grandes (LLM), sin embargo, su crecimiento ilimitado en escenarios de múltiples turnos con estado presenta desafíos importantes.

Leer más →

Comentarios desactivados

9 noviembre, 2025

Lee más sobre el artículo Auditoría de citas impulsada por IA: un protocolo de suposición cero para la verificación sistemática de referencias en la investigación académica

Noticias externas

Auditoría de citas impulsada por IA: un protocolo de suposición cero para la verificación sistemática de referencias en la investigación académica

Resumen: La integridad de las citas académicas enfrenta desafíos persistentes; las investigaciones indican que el 20% de las citas contienen errores y la verificación manual requiere meses de tiempo de expertos. Este artículo presenta una novedosa metodología basada en IA para una auditoría de referencias sistemática e integral utilizando IA agente con capacidades de uso de herramientas.

Leer más →

Comentarios desactivados

9 noviembre, 2025

Pruebas adaptativas para la evaluación de LLM: una alternativa psicométrica a los puntos de referencia estáticos

Gestión de caché KV con estado para LLM: equilibrio de espacio, tiempo, precisión y fidelidad posicional

Auditoría de citas impulsada por IA: un protocolo de suposición cero para la verificación sistemática de referencias en la investigación académica

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto