Observatorio de información y Publicaciones | Página 345 de 1330 | Asociación Mexicana del Internet de las Cosas A.C.

Jugando con el juez: una cadena de pensamiento infiel puede socavar la evaluación del agente

Resumen: Los modelos de lenguaje grande (LLM) se utilizan cada vez más como jueces para evaluar el desempeño de los agentes, particularmente en entornos no verificables donde los juicios se basan en las trayectorias de los agentes, incluido el razonamiento de cadena de pensamiento (CoT).

Leer más →

Comentarios desactivados

21 enero, 2026

Lee más sobre el artículo IB-GRPO: Alinear la recomendación de la ruta de aprendizaje basada en LLM con los objetivos educativos a través de la optimización de políticas relativas al grupo basada en indicadores

Noticias externas

IB-GRPO: Alinear la recomendación de la ruta de aprendizaje basada en LLM con los objetivos educativos a través de la optimización de políticas relativas al grupo basada en indicadores

Resumen:Learning Path Recommendation (LPR) tiene como objetivo generar secuencias personalizadas de elementos de aprendizaje que maximicen el efecto de aprendizaje a largo plazo respetando los principios pedagógicos y las limitaciones operativas.

Leer más →

Comentarios desactivados

21 enero, 2026

Noticias externas

Modelos de lenguaje local para la anonimización adaptativa consciente del contexto de texto confidencial

Resumen: La investigación cualitativa a menudo contiene detalles personales, contextuales y organizacionales que plantean riesgos para la privacidad si no se manejan adecuadamente. La anonimización manual requiere mucho tiempo, es inconsistente y con frecuencia omite identificadores críticos.

Leer más →

Comentarios desactivados

21 enero, 2026

Fin del contenido

No hay más páginas por cargar

← Entradas recientes

Entradas antiguas →

Jugando con el juez: una cadena de pensamiento infiel puede socavar la evaluación del agente

IB-GRPO: Alinear la recomendación de la ruta de aprendizaje basada en LLM con los objetivos educativos a través de la optimización de políticas relativas al grupo basada en indicadores

Modelos de lenguaje local para la anonimización adaptativa consciente del contexto de texto confidencial

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto