Modelos de lenguaje de difusión: un análisis experimental

Resumen: Los modelos de lenguaje grandes (LLM) han revolucionado el modelado del lenguaje a través de la generación autorregresiva, lo que permite un rendimiento sólido en una amplia gama de tareas. Recientemente, los modelos de lenguaje de difusión (DLM) han surgido como un paradigma alternativo que genera texto mediante eliminación iterativa de ruido en lugar de predicción del siguiente token, lo que permite el refinamiento paralelo de secuencias enteras. Si bien se han propuesto numerosas arquitecturas basadas en difusión, las diferencias en los protocolos de evaluación, los conjuntos de datos, los presupuestos de inferencia y los hiperparámetros de generación dificultan comparar sus capacidades y comprender las ventajas y desventajas que ofrecen. En este trabajo, presentamos un análisis experimental sistemático de DLM modernos. Específicamente, evaluamos ocho DLM de última generación en ocho puntos de referencia que abarcan razonamiento, codificación, traducción, conocimiento y resolución de problemas estructurados, al tiempo que consideramos explícitamente tanto la calidad de generación como la eficiencia computacional. Más allá de la evaluación posterior, analizamos el impacto de factores clave del tiempo de inferencia, incluidos los pasos de eliminación de ruido, la longitud del contexto, el tamaño del bloque y las estrategias de desenmascaramiento paralelas, y complementamos experimentos a gran escala con comparaciones controladas de modelos más pequeños entrenados en condiciones idénticas. Nuestro análisis destaca las fortalezas y limitaciones del modelado de lenguaje basado en difusión en diferentes tareas, arquitecturas y presupuestos de inferencia. Mostramos que el comportamiento de los DLM está fuertemente influenciado por las elecciones de diseño en el tiempo de generación, lo que lleva a distintas compensaciones entre rendimiento y eficiencia computacional. En general, nuestro estudio proporciona información práctica sobre las capacidades y características de implementación de los DLM contemporáneos.

Publicado originalmente en export.arxiv.org el 18 de junio de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Detección de patrones de ataque temporales en flujos de trabajo de IA de múltiples agentes: un marco abierto para entrenar modelos de seguridad basados ​​en seguimiento

La ilusión de la equidad: auditoría de intervenciones de equidad con estudios de auditoría

Desarrollo de agentes de crianza primero: creación de agentes de IA expertos en el dominio a través de la cristalización del conocimiento conversacional

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido

Detección de patrones de ataque temporales en flujos de trabajo de IA de múltiples agentes: un marco abierto para entrenar modelos de seguridad basados en seguimiento