O-Toolformer: Modelado y resolución de problemas de investigación de operaciones con modelos de lenguaje grande aumentados de herramientas

Resumen: los modelos de idiomas grandes (LLM) demuestran un fuerte razonamiento matemático, pero la dependencia de las API de código cerrado para las tareas o las tareas aumenta las preocupaciones de privacidad, y la capacitación de modelos de código abierto desde cero incurre en altos costos de cómputo. Introducimos o toolformer, que ajustamos a Llama-3.1-8b-Instructo con una tubería de síntesis de datos semiautomática que genera pares diversos o de respuesta de problemas y aumenta el modelo con solucionadores externos para producir llamadas API. En tres de los cuatro puntos de referencia estándar, o el formador de herramientas alcanza una precisión de ejecución de hasta 80.1%, excediendo las líneas de base de tamaño de tamaño en más de 4.3%. En la evaluación de disparo cero en dos tipos de problemas invisibles o de problemas, alcanza una precisión promedio del 54%, una mejora de 21 puntos porcentuales sobre la línea de base más fuerte. Estos hallazgos validan la eficacia de los LLM de ajuste fino acuático para herramientas para el modelado y resolución de problemas precisos y generalizables o de problemas.

Publicado Originalme en export.arxiv.org El 2 de octubre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Hacer preguntas aclaratorias para obtener preferencias con modelos de lenguaje grandes

Planificación basada en código en mundos de redes con modelos de idiomas grandes

Transformando la industria farmacéutica comercial con IA agente

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido