Resumen: Las conclusiones de la investigación empírica dependen no sólo de los datos sino de una secuencia de decisiones analíticas que los resultados publicados rara vez hacen explícitos. Estudios anteriores de “muchos analistas” han demostrado esto: equipos independientes que prueban la misma hipótesis en el mismo conjunto de datos regularmente llegan a conclusiones contradictorias.
Leer más →
Resumen: Reinterpretamos el clasificador softmax final del Modelo de lenguaje grande (LLM) como un modelo basado en energía (EBM), descomponiendo la cadena de probabilidad de secuencia a secuencia en múltiples EBM que interactúan en la inferencia.
Leer más →
Resumen:El notable desempeño de los sistemas modernos de IA ha sido impulsado por escalas de datos, computación y energía sin precedentes, que superan con creces los recursos requeridos por la inteligencia humana. Esta disparidad resalta la necesidad de nuevos principios rectores y motiva a inspirarse en los principios organizativos fundamentales de la computación cerebral.
Leer más →