IRPAPERS: un punto de referencia de documentos visuales para la recuperación científica y la respuesta a preguntas

Resumen: Los sistemas de inteligencia artificial han logrado un éxito notable en el procesamiento de texto y datos relacionales, pero el procesamiento de documentos visuales sigue estando relativamente poco explorado.

Leer más →

Comentarios desactivados en IRPAPERS: un punto de referencia de documentos visuales para la recuperación científica y la respuesta a preguntas

Trampas epistémicas: desalineación racional impulsada por una especificación errónea del modelo

Resumen: El rápido despliegue de modelos de lenguaje grande y agentes de inteligencia artificial en dominios sociales y técnicos críticos se ve obstaculizado por patologías conductuales persistentes que incluyen adulación, alucinación y engaño estratégico que se resisten a la mitigación mediante el aprendizaje reforzado.

Leer más →

Comentarios desactivados en Trampas epistémicas: desalineación racional impulsada por una especificación errónea del modelo

Aprendizaje curricular para una destilación eficiente de la cadena de pensamiento mediante enmascaramiento consciente de la estructura y GRPO

Resumen: Destilar el razonamiento en cadena de pensamiento (CdT) de grandes modelos lingüísticos a modelos compactos de estudiantes presenta un desafío fundamental: los fundamentos de los docentes suelen ser demasiado detallados para que los modelos más pequeños los reproduzcan fielmente.

Leer más →

Comentarios desactivados en Aprendizaje curricular para una destilación eficiente de la cadena de pensamiento mediante enmascaramiento consciente de la estructura y GRPO

Fin del contenido

No hay más páginas por cargar