ReflCtrl: control de la reflexión LLM mediante ingeniería de representación

Resumen: Los modelos de lenguaje grande (LLM) con razonamiento en cadena de pensamiento (CoT) han logrado un rendimiento sólido en diversas tareas, incluidas matemáticas, codificación y razonamiento general. Una capacidad distintiva de estos modelos de razonamiento es la autorreflexión: la capacidad de revisar y revisar pasos de razonamiento anteriores.

Leer más →

Comentarios desactivados en ReflCtrl: control de la reflexión LLM mediante ingeniería de representación

Evaluación de LLM de Frontier sobre razonamiento matemático a nivel de doctorado: un punto de referencia en un libro de texto en informática teórica sobre algoritmos aleatorios

Resumen:Asignamos a cada modelo la tarea de generar pruebas formales en LaTeX para una serie de lemas y ejercicios que abarcan el libro de texto.

Leer más →

Comentarios desactivados en Evaluación de LLM de Frontier sobre razonamiento matemático a nivel de doctorado: un punto de referencia en un libro de texto en informática teórica sobre algoritmos aleatorios

MURIM: Mecanismo de incentivos multidimensional basado en la reputación para el aprendizaje federado

Resumen: El aprendizaje federado (FL) se ha convertido en un paradigma líder de aprendizaje automático que preserva la privacidad y permite a los participantes compartir actualizaciones de modelos en lugar de datos sin procesar. Sin embargo, FL continúa enfrentando desafíos clave, incluidos débiles incentivos para los clientes, riesgos de privacidad y limitaciones de recursos.

Leer más →

Comentarios desactivados en MURIM: Mecanismo de incentivos multidimensional basado en la reputación para el aprendizaje federado

Fin del contenido

No hay más páginas por cargar