Resumen: El rápido crecimiento de la comunidad de texto a imagen (T2I) ha fomentado un próspero ecosistema en línea de modelos expertos, que son variantes de modelos de difusión previamente entrenados y especializados para diversas habilidades generativas. Sin embargo, los métodos de fusión de modelos existentes siguen siendo limitados a la hora de aprovechar plenamente los abundantes recursos de expertos en línea y todavía tienen dificultades para satisfacer las diversas necesidades de los usuarios. Presentamos DiffGraph, un novedoso marco de fusión de modelos basado en gráficos impulsado por agentes, que aprovecha automáticamente a los expertos en línea y los fusiona de manera flexible para satisfacer las diversas necesidades de los usuarios. Nuestro DiffGraph construye un gráfico escalable y organiza dentro de él expertos en línea en constante expansión a través del registro y la calibración de nodos. Luego, DiffGraph activa dinámicamente subgrafos específicos según las necesidades del usuario, lo que permite combinaciones flexibles de diferentes expertos para lograr la generación deseada por el usuario. Amplios experimentos muestran la eficacia de nuestro método.
Publicado originalmente en export.arxiv.org el 23 de marzo de 2026.
Ver fuente original
