En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Imagen de teledetección Interpretación inteligente con la perspectiva centrada en el lenguaje: principios, métodos y desafíos

Imagen de teledetección Interpretación inteligente con la perspectiva centrada en el lenguaje: principios, métodos y desafíos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El paradigma convencional de la interpretación de la imagen de teledetección ha estado dominada durante mucho tiempo por modelos centrados en la visión, que dependen de las características visuales para la comprensión semántica. Sin embargo, estos modelos enfrentan limitaciones inherentes en el manejo del razonamiento multimodal, la abstracción semántica y la toma de decisiones interactivas. Si bien los avances recientes han introducido modelos de idiomas grandes (LLM) en flujos de trabajo de teledetección, los estudios existentes se centran principalmente en aplicaciones aguas abajo, que carecen de un marco teórico unificado que explica el papel cognitivo del lenguaje. Esta revisión aboga por un cambio de paradigma de la interpretación de detección remota centrada en la visión a el lenguaje. Inspirándose en la teoría del espacio de trabajo global (GWT) de la cognición humana, proponemos un marco centrado en el lenguaje para la interpretación de detección remota que trata a los LLM como el centro cognitivo central que integra espacios perceptuales, de tareas, de conocimiento y acción para permitir la comprensión unificada, el razonamiento y la toma de decisiones. Primero exploramos el potencial de LLM como el componente cognitivo central en la interpretación de la teledetección, y luego resumimos los desafíos técnicos centrales, incluida la representación multimodal unificada, la asociación de conocimiento y el razonamiento y la toma de decisiones. Además, construimos un mecanismo de interpretación global impulsado por el espacio de trabajo y revisamos cómo las soluciones centradas en el lenguaje abordan cada desafío. Finalmente, describimos las futuras direcciones de investigación desde cuatro perspectivas: alineación adaptativa de datos multimodales, comprensión de tareas bajo limitaciones de conocimiento dinámico, razonamiento confiable e interacción autónoma. Este trabajo tiene como objetivo proporcionar una base conceptual para la próxima generación de sistemas de interpretación de teledetección y establecer una hoja de ruta hacia el análisis geoespacial inteligente impulsado por la cognición.

Publicado Originalme en export.arxiv.org El 11 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web