Verbalizar la incertidumbre de orden superior de LLM a través de probabilidades imprecisas

Resumen: A pesar de la creciente demanda de obtener incertidumbre a partir de grandes modelos de lenguaje (LLM), la evidencia empírica sugiere que el comportamiento de los LLM no siempre es capturado adecuadamente por las técnicas de obtención desarrolladas bajo el marco de incertidumbre probabilístico clásico.

Leer más →

Comentarios desactivados en Verbalizar la incertidumbre de orden superior de LLM a través de probabilidades imprecisas

MoE-SpAc: inferencia eficiente de MoE basada en la utilidad de activación especulativa en escenarios de borde heterogéneos

Resumen: Los modelos de mezcla de expertos (MoE) permiten un rendimiento escalable pero enfrentan graves limitaciones de memoria en los dispositivos perimetrales. Las estrategias de descarga existentes luchan contra los cuellos de botella de E/S debido a la naturaleza dinámica y con poca información de la activación experta autorregresiva.

Leer más →

Comentarios desactivados en MoE-SpAc: inferencia eficiente de MoE basada en la utilidad de activación especulativa en escenarios de borde heterogéneos

Más allá de los escalares: evaluación y comprensión del razonamiento LLM a través del progreso y la estabilidad geométricos

Resumen: La evaluación de la confiabilidad del LLM mediante probabilidades escalares a menudo no logra capturar la dinámica estructural del razonamiento. Presentamos TRACED, un marco que evalúa la calidad del razonamiento a través de cinemática geométrica fundamentada teóricamente.

Leer más →

Comentarios desactivados en Más allá de los escalares: evaluación y comprensión del razonamiento LLM a través del progreso y la estabilidad geométricos

Fin del contenido

No hay más páginas por cargar