Observatorio de información y Publicaciones | Página 449 de 1331 | Asociación Mexicana del Internet de las Cosas A.C.

ReflCtrl: control de la reflexión LLM mediante ingeniería de representación

Resumen: Los modelos de lenguaje grande (LLM) con razonamiento en cadena de pensamiento (CoT) han logrado un rendimiento sólido en diversas tareas, incluidas matemáticas, codificación y razonamiento general. Una capacidad distintiva de estos modelos de razonamiento es la autorreflexión: la capacidad de revisar y revisar pasos de razonamiento anteriores.

Leer más →

Comentarios desactivados

16 diciembre, 2025

Lee más sobre el artículo Evaluación de LLM de Frontier sobre razonamiento matemático a nivel de doctorado: un punto de referencia en un libro de texto en informática teórica sobre algoritmos aleatorios

Noticias externas

Evaluación de LLM de Frontier sobre razonamiento matemático a nivel de doctorado: un punto de referencia en un libro de texto en informática teórica sobre algoritmos aleatorios

Resumen:Asignamos a cada modelo la tarea de generar pruebas formales en LaTeX para una serie de lemas y ejercicios que abarcan el libro de texto.

Leer más →

Comentarios desactivados

16 diciembre, 2025

Noticias externas

MURIM: Mecanismo de incentivos multidimensional basado en la reputación para el aprendizaje federado

Resumen: El aprendizaje federado (FL) se ha convertido en un paradigma líder de aprendizaje automático que preserva la privacidad y permite a los participantes compartir actualizaciones de modelos en lugar de datos sin procesar. Sin embargo, FL continúa enfrentando desafíos clave, incluidos débiles incentivos para los clientes, riesgos de privacidad y limitaciones de recursos.

Leer más →

Comentarios desactivados

16 diciembre, 2025

Fin del contenido

No hay más páginas por cargar

← Entradas recientes

Entradas antiguas →

ReflCtrl: control de la reflexión LLM mediante ingeniería de representación

Evaluación de LLM de Frontier sobre razonamiento matemático a nivel de doctorado: un punto de referencia en un libro de texto en informática teórica sobre algoritmos aleatorios

MURIM: Mecanismo de incentivos multidimensional basado en la reputación para el aprendizaje federado

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto