Colapso del contexto: aprendizaje en contexto y colapso del modelo
Resumen: Esta tesis investiga dos fenómenos clave en los modelos de lenguaje grande (LLM): el aprendizaje en contexto (ICL) y el colapso del modelo. Estudiamos ICL en un transformador lineal con pesos vinculados entrenados en tareas de regresión lineal y mostramos que minimizar la pérdida en contexto conduce a una transición de fase en los parámetros aprendidos.
Leer más →