MAGE-KT: Seguimiento de conocimiento mejorado con gráficos de múltiples agentes con recuperación de subgrafos y fusión asimétrica

Resumen:Knowledge Tracing (KT) tiene como objetivo modelar la trayectoria de aprendizaje de un estudiante y predecir el desempeño en la siguiente pregunta. Un desafío clave es cómo representar mejor las relaciones entre los estudiantes, las preguntas y los conceptos de conocimiento (KC). Recientemente, los paradigmas KT basados ​​en gráficos se han mostrado prometedores para este problema.

Leer más →

Comentarios desactivados en MAGE-KT: Seguimiento de conocimiento mejorado con gráficos de múltiples agentes con recuperación de subgrafos y fusión asimétrica

SycoEval-EM: Evaluación de adulación de modelos de lenguaje grandes en encuentros clínicos simulados para atención de emergencia

Resumen: Los modelos de lenguaje grande (LLM) son prometedores en el apoyo a las decisiones clínicas, pero corren el riesgo de ceder a la presión del paciente para que reciba una atención inadecuada. Presentamos SycoEval-EM, un marco de simulación de múltiples agentes que evalúa la solidez del LLM mediante la persuasión adversaria del paciente en medicina de emergencia. En 20 LLM y 1.

Leer más →

Comentarios desactivados en SycoEval-EM: Evaluación de adulación de modelos de lenguaje grandes en encuentros clínicos simulados para atención de emergencia

Cuando los agentes no actúan: un marco de diagnóstico para la confiabilidad de la invocación de herramientas en sistemas LLM de múltiples agentes

Resumen: Los sistemas multiagente impulsados ​​por grandes modelos de lenguaje (LLM) están transformando la automatización empresarial, pero las metodologías de evaluación sistemática para evaluar la confiabilidad del uso de herramientas siguen estando subdesarrolladas.

Leer más →

Comentarios desactivados en Cuando los agentes no actúan: un marco de diagnóstico para la confiabilidad de la invocación de herramientas en sistemas LLM de múltiples agentes

Fin del contenido

No hay más páginas por cargar