Resumen: El espacio $mathcal{P}_2(mathbb{R}^d$) de medidas de probabilidad con segundo momento finito conlleva una geometría natural: la distancia cuadrática de Wasserstein W_2 lo convierte en un espacio métrico completo y, siguiendo a Otto, una variedad riemanniana (formal) cuyas geodésicas son las interpolaciones de transporte óptimo. En esta variedad, el flujo gradiente de la energía libre F(rho) = KL(rho || pi) es exactamente la ecuación de Fokker-Planck, y su discretización implícita de Euler es el esquema JKO. Esta es la geometría subyacente a los modelos de difusión: el proceso directo hace descender la energía libre, y cada paso de eliminación de ruido realiza un paso JKO, que recupera DDPM, DDIM, NCSN/SMLD y Energy Matching; Este es un esquema, no teorías separadas. La misma variedad sustenta un segundo principio variacional. Sus geodésicas (las curvas de acción mínima de la fórmula de Benamou-Brenier) son precisamente las rutas de transporte óptimas que aprende Flow Matching. Al fijar ambos puntos finales y seguir la geodésica, la generación se convierte en una EDO determinista a lo largo de una línea recta, por lo que hay muchos menos pasos de muestreo. Colocar ambas familias de modelos en una variedad hace que su relación sea exacta: la difusión sigue un flujo gradiente de energía libre, un problema de valor inicial; La coincidencia de flujo de transporte óptimo sigue una geodésica de Wasserstein, un problema de valor límite. Los dos llegan a los mismos puntos finales por caminos diferentes.
Publicado originalmente en export.arxiv.org el 23 de junio de 2026.
Ver fuente original
