Resumen: Los modelos de lenguaje grandes (LLM) han revolucionado el modelado del lenguaje a través de la generación autorregresiva, lo que permite un rendimiento sólido en una amplia gama de tareas. Recientemente, los modelos de lenguaje de difusión (DLM) han surgido como un paradigma alternativo que genera texto mediante eliminación iterativa de ruido en lugar de predicción del siguiente token, lo que permite el refinamiento paralelo de secuencias enteras. Si bien se han propuesto numerosas arquitecturas basadas en difusión, las diferencias en los protocolos de evaluación, los conjuntos de datos, los presupuestos de inferencia y los hiperparámetros de generación dificultan comparar sus capacidades y comprender las ventajas y desventajas que ofrecen. En este trabajo, presentamos un análisis experimental sistemático de DLM modernos. Específicamente, evaluamos ocho DLM de última generación en ocho puntos de referencia que abarcan razonamiento, codificación, traducción, conocimiento y resolución de problemas estructurados, al tiempo que consideramos explícitamente tanto la calidad de generación como la eficiencia computacional. Más allá de la evaluación posterior, analizamos el impacto de factores clave del tiempo de inferencia, incluidos los pasos de eliminación de ruido, la longitud del contexto, el tamaño del bloque y las estrategias de desenmascaramiento paralelas, y complementamos experimentos a gran escala con comparaciones controladas de modelos más pequeños entrenados en condiciones idénticas. Nuestro análisis destaca las fortalezas y limitaciones del modelado de lenguaje basado en difusión en diferentes tareas, arquitecturas y presupuestos de inferencia. Mostramos que el comportamiento de los DLM está fuertemente influenciado por las elecciones de diseño en el tiempo de generación, lo que lleva a distintas compensaciones entre rendimiento y eficiencia computacional. En general, nuestro estudio proporciona información práctica sobre las capacidades y características de implementación de los DLM contemporáneos.
Publicado originalmente en export.arxiv.org el 18 de junio de 2026.
Ver fuente original
