Ilusiones de reflexión: una tarea abierta revela fallas sistemáticas en el razonamiento reflexivo de los modelos de lenguaje grande

Resumen: Los seres humanos no sólo encuentran errores después del hecho: a menudo los detectamos a mitad de camino porque la “reflexión” está ligada al objetivo y sus limitaciones.

Leer más →

Comentarios desactivados en Ilusiones de reflexión: una tarea abierta revela fallas sistemáticas en el razonamiento reflexivo de los modelos de lenguaje grande

FABRIC: Marco para la creación de inteligencia realista basada en agentes

Resumen:Presentamos un marco unificado para sintetizar datos agentes utilizando únicamente LLM, sin ninguna supervisión humana. Este marco descompone la generación en canales modulares que producen registros de interacción completos que abarcan especificaciones de tareas, definiciones de herramientas, pseudocódigo de políticas, intercambios de lenguaje natural y seguimientos de ejecución.

Leer más →

Comentarios desactivados en FABRIC: Marco para la creación de inteligencia realista basada en agentes

ssToken: selección de tokens automodulada y con reconocimiento semántico para el ajuste fino de LLM

Resumen:La calidad de los datos desempeña un papel fundamental en la mejora del ajuste fino supervisado (SFT) para modelos de lenguajes grandes (LLM), y la selección de datos a nivel de token se ha convertido en una dirección prometedora por su naturaleza detallada.

Leer más →

Comentarios desactivados en ssToken: selección de tokens automodulada y con reconocimiento semántico para el ajuste fino de LLM

Fin del contenido

No hay más páginas por cargar