Anotar la cadena de pensamiento: un conjunto de datos etiquetados por comportamiento para la seguridad de la IA

Resumen: Advertencia de contenido: este documento analiza la seguridad de la IA en el contexto de indicaciones dañinas y puede contener referencias a contenido potencialmente dañino.

Publicado originalmente en export.arxiv.org el 21 de octubre de 2025.

Leer más →

Comentarios desactivados en Anotar la cadena de pensamiento: un conjunto de datos etiquetados por comportamiento para la seguridad de la IA

Aprender de patrones de generalización: un enfoque basado en evaluaciones para mejorar el aumento de datos para ajustar modelos de lenguajes pequeños

Resumen: Los modelos de lenguaje pequeño (SLM) ofrecen ventajas convincentes en el costo de implementación y la latencia, pero su precisión a menudo va por detrás de los modelos más grandes, particularmente para tareas complejas específicas de un dominio.

Leer más →

Comentarios desactivados en Aprender de patrones de generalización: un enfoque basado en evaluaciones para mejorar el aumento de datos para ajustar modelos de lenguajes pequeños

Medición del razonamiento en LLM: un nuevo ángulo dialéctico

Resumen: ¿Qué significa realmente que un modelo de lenguaje “razone”? La mayoría de las evaluaciones y puntos de referencia actuales recompensan las respuestas independientes correctas de los modelos, pero la corrección por sí sola revela poco sobre el proceso que las produjo.

Leer más →

Comentarios desactivados en Medición del razonamiento en LLM: un nuevo ángulo dialéctico

Fin del contenido

No hay más páginas por cargar