Resumen: Los modelos de lenguaje de razonamiento como Deepseek-R1 producen largos rastros de cadena de pensamiento durante el tiempo de inferencia que los hacen costosos de desplegar a escala.
Leer más →
Resumen: Los grandes modelos multimodales (LMM) codifican leyes físicas universales observadas durante el entrenamiento, como la conservación del momento, como conocimiento paramétrico. Permite a los LMM responder consultas de razonamiento físico, como el resultado de un posible evento de colisión a partir de la entrada visual.
Leer más →
Resumen: La ciencia cognitiva y la informática teórica buscan clasificar y explicar la dificultad de las tareas. Los mecanismos de inteligencia son aquellos que reducen la dificultad de la tarea.
Leer más →