Resumen: El aprendizaje por refuerzo con recompensas verificables (RLVR) demuestra un potencial significativo para mejorar las capacidades de razonamiento de los modelos de lenguaje grandes (LLM).
Leer más →
Resumen: En el aprendizaje de habilidades procedimentales, las explicaciones instructivas deben transmitir no sólo los pasos, sino también la lógica causal, dirigida a objetivos y compositiva detrás de ellos. Los modelos de lenguaje grande (LLM) a menudo producen respuestas fluidas pero superficiales que pasan por alto esta estructura.
Leer más →
Resumen: La cognición encarnada sostiene que la inteligencia surge de la interacción sensoriomotora más que de la observación pasiva.
Leer más →