En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->O-Toolformer: Modelado y resolución de problemas de investigación de operaciones con modelos de lenguaje grande aumentados de herramientas

O-Toolformer: Modelado y resolución de problemas de investigación de operaciones con modelos de lenguaje grande aumentados de herramientas

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: los modelos de idiomas grandes (LLM) demuestran un fuerte razonamiento matemático, pero la dependencia de las API de código cerrado para las tareas o las tareas aumenta las preocupaciones de privacidad, y la capacitación de modelos de código abierto desde cero incurre en altos costos de cómputo. Introducimos o toolformer, que ajustamos a Llama-3.1-8b-Instructo con una tubería de síntesis de datos semiautomática que genera pares diversos o de respuesta de problemas y aumenta el modelo con solucionadores externos para producir llamadas API. En tres de los cuatro puntos de referencia estándar, o el formador de herramientas alcanza una precisión de ejecución de hasta 80.1%, excediendo las líneas de base de tamaño de tamaño en más de 4.3%. En la evaluación de disparo cero en dos tipos de problemas invisibles o de problemas, alcanza una precisión promedio del 54%, una mejora de 21 puntos porcentuales sobre la línea de base más fuerte. Estos hallazgos validan la eficacia de los LLM de ajuste fino acuático para herramientas para el modelado y resolución de problemas precisos y generalizables o de problemas.

Publicado Originalme en export.arxiv.org El 2 de octubre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web