Resumen: Introducimos a Logiplan, un nuevo punto de referencia diseñado para evaluar las capacidades de los grandes modelos de idiomas (LLM) en la planificación lógica y el razonamiento sobre estructuras relacionales complejas.
Leer más →
Resumen: Los descubrimientos científicos se basan cada vez más en un razonamiento multimodal complejo basado en datos científicos intensivos en información y experiencia específica del dominio.
Leer más →
Resumen: A medida que los modelos se vuelven cada vez más sofisticados, los puntos de referencia de algoritmos convencionales están cada vez más saturados, subrayando la necesidad de puntos de referencia más desafiantes para guiar mejoras futuras en el razonamiento algorítmico.
Leer más →