Más allá de la finalización: sondeo del seguimiento del estado acumulativo para predecir el rendimiento del agente LLM

Resumen:La tasa de finalización de tareas es el indicador estándar de la capacidad del agente LLM, pero los modelos con puntuaciones de finalización idénticas pueden diferir sustancialmente en su capacidad para rastrear el estado intermedio.

Leer más →

Comentarios desactivados en Más allá de la finalización: sondeo del seguimiento del estado acumulativo para predecir el rendimiento del agente LLM

Alineación de LLM con solucionadores neuronales de gráficos para optimización combinatoria

Resumen: Investigaciones recientes han demostrado la eficacia de los modelos de lenguaje grande (LLM) en la resolución de problemas de optimización combinatoria (COP) mediante la representación de tareas e instancias en lenguaje natural.

Leer más →

Comentarios desactivados en Alineación de LLM con solucionadores neuronales de gráficos para optimización combinatoria

Cuando la verificación duele: efectos asimétricos de la retroalimentación de múltiples agentes en la tutoría de prueba lógica

Resumen: Los modelos de lenguaje grande (LLM) se utilizan cada vez más para la tutoría automatizada, pero su confiabilidad en dominios simbólicos estructurados aún no está clara. Estudiamos la retroalimentación a nivel de paso para pruebas de lógica proposicional, que requieren un razonamiento simbólico preciso alineado con el estado de prueba actual del alumno.

Leer más →

Comentarios desactivados en Cuando la verificación duele: efectos asimétricos de la retroalimentación de múltiples agentes en la tutoría de prueba lógica

Fin del contenido

No hay más páginas por cargar