Resumen:Knowledge Tracing (KT) tiene como objetivo modelar la trayectoria de aprendizaje de un estudiante y predecir el desempeño en la siguiente pregunta. Un desafío clave es cómo representar mejor las relaciones entre los estudiantes, las preguntas y los conceptos de conocimiento (KC). Recientemente, los paradigmas KT basados en gráficos se han mostrado prometedores para este problema.
Leer más →
Resumen: Los modelos de lenguaje grande (LLM) son prometedores en el apoyo a las decisiones clínicas, pero corren el riesgo de ceder a la presión del paciente para que reciba una atención inadecuada. Presentamos SycoEval-EM, un marco de simulación de múltiples agentes que evalúa la solidez del LLM mediante la persuasión adversaria del paciente en medicina de emergencia. En 20 LLM y 1.
Leer más →
Resumen: Los sistemas multiagente impulsados por grandes modelos de lenguaje (LLM) están transformando la automatización empresarial, pero las metodologías de evaluación sistemática para evaluar la confiabilidad del uso de herramientas siguen estando subdesarrolladas.
Leer más →