En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Evaluación de modelos de lenguaje pequeño para sistemas agentes de apoyo a la toma de decisiones en la granja

Evaluación de modelos de lenguaje pequeño para sistemas agentes de apoyo a la toma de decisiones en la granja

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de lenguaje grande (LLM) tienen potencial para apoyar a los académicos y agricultores del sector lechero al respaldar la toma de decisiones y ampliar el acceso al conocimiento para las partes interesadas con experiencia técnica limitada. Sin embargo, la importante demanda computacional restringe el acceso a LLM casi exclusivamente a través de servicios basados ​​en la nube, lo que hace que las herramientas de apoyo a la toma de decisiones basadas en LLM no sean prácticas para la producción lechera. Para abordar esta brecha, se necesitan alternativas livianas capaces de ejecutarse localmente en hardware agrícola. En este trabajo, comparamos 20 modelos de lenguaje pequeño (SLM) de código abierto disponibles en HuggingFace bajo restricciones informáticas realistas en la granja. Sobre la base de nuestro trabajo anterior, desarrollamos un sistema de IA agente que integra cinco agentes de tareas específicas: búsqueda de literatura, búsqueda web, interacción de bases de datos SQL, interacción de bases de datos NoSQL y generación de gráficos siguiendo modelos predictivos. La evaluación se realizó en dos fases. En la primera fase, se utilizaron cinco preguntas de prueba para la selección inicial para identificar modelos capaces de seguir instrucciones básicas relacionadas con los lácteos y funcionar de manera confiable en un entorno computacional restringido. Los modelos que pasaron esta etapa preliminar fueron evaluados usando 30 preguntas (cinco por categoría de tarea mencionada anteriormente, más una categoría que aborda la integridad y la mala conducta) en la fase dos. En los resultados, Qwen-4B logró un rendimiento superior en la mayoría de las categorías de tareas, aunque mostró una efectividad inestable en las interacciones de bases de datos NoSQL a través de PySpark. Hasta donde sabemos, este es el primer trabajo que evalúa explícitamente la viabilidad de SLM como motores para la toma de decisiones en las granjas lecheras, con énfasis central en la privacidad y la eficiencia computacional. Si bien los resultados resaltan la promesa de las herramientas asistidas por SLM para su implementación práctica en la producción lechera, persisten desafíos y aún es necesario realizar ajustes para perfeccionar el desempeño de SLM en cuestiones específicas de los lácteos.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web