Escala hacia el límite de información del conjunto de instrucciones: Informe técnico de InfinityInstruct-Sugject

Resumen: El ajuste de instrucciones se ha convertido en una base para desbloquear las capacidades de los modelos preventivos a gran escala y mejorar su rendimiento en tareas complejas. Por lo tanto, la construcción de conjuntos de datos de instrucciones de alta calidad es crucial para mejorar el rendimiento del modelo y la generalización. Aunque los conjuntos de datos de instrucciones actuales han alcanzado decenas de millones de muestras, los modelos finetos aún pueden luchar con seguimiento de instrucción compleja y tareas en dominios raros. Esto se debe principalmente a la expansión limitada tanto en “ cobertura ” (cobertura de tipos de tareas y áreas de conocimiento) como de “ profundidad ” (complejidad de instrucciones) del conjunto de instrucciones. Para abordar este problema, proponemos un marco de construcción de datos de instrucción sistemática, que integra un sistema de etiquetado jerárquico, un algoritmo informativo de selección de semillas, un proceso de síntesis de datos evolutivo y un diagnóstico de deficiencia de modelo con generación de datos dirigido. Estos componentes forman un circuito cerrado iterativo para mejorar continuamente la cobertura y la profundidad de los datos de instrucción. Según este marco, construimos InfinityStuct Subject, un conjunto de datos de alta calidad que contiene ~ 1,5 millones de instrucciones. Los experimentos en múltiples modelos de base y tareas de referencia demuestran su efectividad para mejorar las capacidades de seguimiento de las instrucciones. Análisis adicionales sugieren que el sujeto InfinityInstruct muestra cobertura y profundidad ampliada en comparación con conjuntos de datos de instrucciones sintetizados comparables. Nuestro trabajo establece una base teórica y práctica para la evolución eficiente y continua de los conjuntos de datos de instrucciones, pasando de la expansión de la cantidad de datos a la mejora cualitativa.

Publicado Originalme en export.arxiv.org El 9 de julio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Creación de agentes de inteligencia artificial para mejorar las solicitudes de recomendación laboral a extraños

Evaluación de comodidad urbana en la era de la planificación digital: un marco multidimensional, basado en datos y asistido por AI-AI-AI

Sociedad 5.0: un concepto japonés para una sociedad superinteligente

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido