Resumen: Los enfoques estándar del aprendizaje por refuerzo robusto suponen que las fuentes de retroalimentación son globalmente confiables o globalmente conflictivas. En este artículo, desafiamos esta suposición e identificamos un modo de falla más sutil.
Leer más →
Resumen: Los modelos de lenguaje grande de difusión (dLLM) generan texto mediante eliminación iterativa de ruido, pero constantemente tienen un rendimiento inferior en el razonamiento de varios pasos.
Leer más →
Resumen: Los modelos de lenguaje grande (LLM) se posicionan cada vez más como herramientas escalables para anotar datos educativos, incluido el discurso en el aula, registros de interacción y artefactos de aprendizaje cualitativo.
Leer más →