En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Agrigpt: un ecosistema de modelo de lenguaje grande para la agricultura

Agrigpt: un ecosistema de modelo de lenguaje grande para la agricultura

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: a pesar del rápido progreso de los modelos de idiomas grandes (LLM), su aplicación en la agricultura sigue siendo limitada debido a la falta de modelos específicos de dominio, conjuntos de datos curados y marcos de evaluación robustos. Para abordar estos desafíos, proponemos Agrigpt, un ecosistema LLM especializado en dominio para el uso agrícola. En esencia, diseñamos un motor de datos escalable de múltiples agentes que compila sistemáticamente las fuentes de datos creíbles en Agri-342k, un conjunto de datos de preguntas estandarizadas (QA) de alta calidad y de alta calidad. Entrenado en este conjunto de datos, Agrigpt apoya una amplia gama de partes interesadas agrícolas, desde profesionales hasta responsables políticos. Para mejorar la base objetiva, empleamos Tri-Rag, un marco de generación de recuperación de tres canales acuático que combina la recuperación densa, la recuperación escasa y el razonamiento de gráficos de conocimiento múltiple, mejorando así la confiabilidad de razonamiento de la LLM. Para una evaluación integral, presentamos Agribench-13k, un conjunto de referencia que comprende 13 tareas con diferentes tipos y complejidades. Los experimentos demuestran que AGRIGPT supera significativamente a los LLM de uso general tanto en la adaptación del dominio como en el razonamiento. Más allá del modelo en sí, Agrigpt representa un ecosistema LLM modular y extensible para la agricultura, que comprende la construcción de datos estructurados, la generación de recuperación y la evaluación específica del dominio. Este trabajo proporciona un marco generalizable para desarrollar LLM científicos y especializados en la industria. Todos los modelos, conjuntos de datos y código se publicarán para empoderar a las comunidades agrícolas, especialmente en regiones desatendidas, y para promover una investigación abierta e impactante.

Publicado Originalme en export.arxiv.org El 12 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web