Resumen: Los seres humanos no sólo encuentran errores después del hecho: a menudo los detectamos a mitad de camino porque la “reflexión” está ligada al objetivo y sus limitaciones.
Leer más →
Resumen:Presentamos un marco unificado para sintetizar datos agentes utilizando únicamente LLM, sin ninguna supervisión humana. Este marco descompone la generación en canales modulares que producen registros de interacción completos que abarcan especificaciones de tareas, definiciones de herramientas, pseudocódigo de políticas, intercambios de lenguaje natural y seguimientos de ejecución.
Leer más →
Resumen:La calidad de los datos desempeña un papel fundamental en la mejora del ajuste fino supervisado (SFT) para modelos de lenguajes grandes (LLM), y la selección de datos a nivel de token se ha convertido en una dirección prometedora por su naturaleza detallada.
Leer más →