Una comparación formal entre la cadena de pensamiento y el pensamiento latente

Resumen: La cadena de pensamiento (COT) provoca un razonamiento en modelos de lenguaje grande al generar explícitamente pasos intermedios en el lenguaje natural. En contraste, el pensamiento latente en los modelos en bucle funciona directamente en el espacio latente continuo, lo que permite el cálculo más allá de las representaciones lingüísticas discretas. Si bien ambos enfoques explotan el cálculo iterativo, sus capacidades comparativas siguen siendo subexploradas. En este trabajo, presentamos un análisis formal que muestra que el pensamiento latente en los transformadores en bucle permite el cálculo paralelo, que es más eficiente que el proceso inherentemente secuencial de COT. En contraste, COT aprovecha la decodificación estocástica a soluciones aproximadas a problemas donde el cálculo exacto es intratable. Estas separaciones sugieren las tareas para las cuales la recursión basada en la profundidad es más adecuada, ofreciendo así una guía práctica para elegir entre paradigmas de razonamiento. El código está disponible en esta URL HTTPS.

Publicado Originalme en export.arxiv.org El 30 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Mixrep: mezcla de representación oculta para el reconocimiento de voz de bajo recurso

Smart Connectivity Test Beds Uso de DIHS

Explicando los rompecabezas de hitori: estadificación de prueba neurosymbólica para decisiones secuenciales

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido