Los modelos de razonamiento se pueden podar con precisión a través de la reconstrucción de la cadena de pensamiento

Resumen: Los modelos de lenguaje de razonamiento como Deepseek-R1 producen largos rastros de cadena de pensamiento durante el tiempo de inferencia que los hacen costosos de desplegar a escala.

Leer más →

Comentarios desactivados en Los modelos de razonamiento se pueden podar con precisión a través de la reconstrucción de la cadena de pensamiento

Inphyre descubre: los grandes modelos multimodales luchan en el razonamiento físico inductivo

Resumen: Los grandes modelos multimodales (LMM) codifican leyes físicas universales observadas durante el entrenamiento, como la conservación del momento, como conocimiento paramétrico. Permite a los LMM responder consultas de razonamiento físico, como el resultado de un posible evento de colisión a partir de la entrada visual.

Leer más →

Comentarios desactivados en Inphyre descubre: los grandes modelos multimodales luchan en el razonamiento físico inductivo

Fin del contenido

No hay más páginas por cargar