Resumen: Este documento presenta una investigación artística y técnica sobre los mecanismos de atención de los transformadores de difusión de video. Inspirados en los primeros videos que manipularon señales de video analógicas para crear una nueva estética visual, este estudio propone un método para extraer y visualizar mapas de atención cruzada en modelos de video generativos. Construido en el modelo WAN de código abierto, nuestra herramienta proporciona una ventana interpretable al comportamiento temporal y espacial de la atención en la generación de texto a video. A través de sondas exploratorias y un estudio de caso artístico, examinamos el potencial de los mapas de atención como herramientas analíticas y material artístico en bruto. Este trabajo contribuye al creciente campo de IA explicable para las artes (Xaixarts), invitando a los artistas a reclamar el funcionamiento interno de la IA como un medio creativo.
Publicado Originalme en export.arxiv.org El 8 de septiembre de 2025.
Ver Fuente Original