Resumen: Los agentes de aprendizaje por refuerzo profundo (DRL) logran un rendimiento notable en el control continuo, pero permanecen opacos, lo que dificulta el despliegue en dominios críticos para la seguridad.
Leer más →
Resumen: Los modelos de clasificación transversal a menudo se implementan como si las predicciones puntuales fueran suficientes: el modelo genera puntuaciones y la cartera sigue el orden inducido. En condiciones de no estacionariedad, los líderes pueden fallar durante los cambios de régimen.
Leer más →
Resumen: Los puntos de referencia tradicionales como HumanEval y MBPP prueban la lógica y la sintaxis de manera efectiva, pero fallan cuando el código debe producir imágenes pedagógicas y dinámicas.
Leer más →