Resumen: Los modelos básicos para la agricultura se basan cada vez más en datos espaciotemporales masivos (por ejemplo, sensores remotos multiespectrales, cuadrículas de suelo y registros de gestión a nivel de campo) y logran un sólido rendimiento en pronóstico y monitoreo. Sin embargo, estos modelos carecen de razonamiento basado en el lenguaje y capacidades interactivas, lo que limita su utilidad en los flujos de trabajo agronómicos del mundo real. Mientras tanto, los modelos de lenguaje grande (LLM) se destacan en la interpretación y generación de texto, pero no pueden razonar directamente sobre conjuntos de datos agrícolas heterogéneos y de alta dimensión. Cerramos esta brecha con un marco agente para la ciencia agrícola. Proporciona un entorno de ejecución de Python, AgriWorld, que expone herramientas unificadas para consultas geoespaciales sobre parcelas de campo, análisis de series temporales de teledetección, simulación de crecimiento de cultivos y predictores de tareas específicas (por ejemplo, rendimiento, estrés y riesgo de enfermedades). Además de este entorno, diseñamos un agente LLM de múltiples turnos, Agro-Reflective, que escribe código de forma iterativa, observa los resultados de la ejecución y refina su análisis mediante un ciclo de ejecución-observación-refinación. Presentamos AgroBench, con generación de datos escalable para diversos controles de calidad agrícolas que abarcan búsquedas, pronósticos, detección de anomalías y análisis contrafactuales de “qué pasaría si”. Los experimentos superan las líneas base de solo texto y de uso directo de herramientas, lo que valida la reflexión impulsada por la ejecución para un razonamiento agrícola confiable.
Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original
