Resumen: Reinterpretamos el clasificador softmax final del Modelo de lenguaje grande (LLM) como un modelo basado en energía (EBM), descomponiendo la cadena de probabilidad de secuencia a secuencia en múltiples EBM que interactúan en la inferencia.
Leer más →
Resumen:El notable desempeño de los sistemas modernos de IA ha sido impulsado por escalas de datos, computación y energía sin precedentes, que superan con creces los recursos requeridos por la inteligencia humana. Esta disparidad resalta la necesidad de nuevos principios rectores y motiva a inspirarse en los principios organizativos fundamentales de la computación cerebral.
Leer más →
Resumen: Los sistemas modernos de clasificación a gran escala operan dentro de un panorama sofisticado de objetivos en competencia, limitaciones operativas y requisitos de productos en evolución.
Leer más →