Resumen:Comprender el cambio del entorno urbano es esencial para el desarrollo sostenible. Sin embargo, los enfoques actuales, en particular la detección de cambios mediante teledetección, a menudo se basan en análisis rígidos y unimodales. Para superar estas limitaciones, proponemos MMUEChange, un marco de agente multimodal que integra de manera flexible datos urbanos heterogéneos a través de un conjunto de herramientas modular y un módulo central, Modality Controller, para la alineación intermodal e intramodal, lo que permite un análisis sólido de escenarios de cambio urbano complejos. Los estudios de caso incluyen: un cambio hacia parques pequeños y centrados en la comunidad en Nueva York, que reflejan los esfuerzos locales en materia de espacios verdes; la propagación de la contaminación concentrada del agua en los distritos de Hong Kong, lo que apunta a una gestión coordinada del agua; y una disminución notable en los vertederos a cielo abierto en Shenzhen, con vínculos contrastantes entre la actividad económica nocturna y los tipos de desechos, lo que indica diferentes presiones urbanas detrás de los desechos domésticos y de construcción. En comparación con la línea de base de mejor rendimiento, el agente MMUEChange logra una mejora del 46,7 % en la tasa de éxito de la tarea y mitiga eficazmente las alucinaciones, lo que demuestra su capacidad para respaldar tareas complejas de análisis de cambios urbanos con implicaciones políticas en el mundo real.
Publicado originalmente en export.arxiv.org el 11 de enero de 2026.
Ver fuente original
