En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Hacia el monitoreo inteligente del desarrollo de parques urbanos: agentes LLM para la fusión y el análisis de información multimodal

Hacia el monitoreo inteligente del desarrollo de parques urbanos: agentes LLM para la fusión y el análisis de información multimodal

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Como parte importante de la urbanización, el seguimiento del desarrollo de parques de nueva construcción es de gran importancia para evaluar el efecto de la planificación urbana y optimizar la asignación de recursos. Sin embargo, los métodos tradicionales de detección de cambios basados ​​en imágenes de teledetección tienen limitaciones obvias en el análisis inteligente y de alto nivel y, por lo tanto, son difíciles de cumplir con los requisitos de la planificación y gestión urbanas actuales. Ante la creciente demanda de análisis de datos multimodales complejos en el monitoreo del desarrollo de parques urbanos, estos métodos a menudo no brindan capacidades de análisis flexibles para diversos escenarios de aplicación. Este estudio propone un marco de agente LLM multimodal, cuyo objetivo es aprovechar al máximo la comprensión semántica y las capacidades de razonamiento de LLM para enfrentar los desafíos en el monitoreo del desarrollo de parques urbanos. En este marco, se diseña un mecanismo general de alineación de datos horizontal y vertical para garantizar la coherencia y el seguimiento eficaz de los datos multimodales. Al mismo tiempo, se construye un conjunto de herramientas específico para aliviar los problemas de alucinaciones de LLM debido a la falta de conocimiento específico del dominio. En comparación con el GPT-4o básico y otros agentes, nuestro enfoque permite una sólida fusión y análisis de información multimodal, ofreciendo soluciones confiables y escalables adaptadas a las diversas y cambiantes demandas del monitoreo del desarrollo de parques urbanos.

Publicado originalmente en export.arxiv.org el 28 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web