En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Una comparación formal entre la cadena de pensamiento y el pensamiento latente

Una comparación formal entre la cadena de pensamiento y el pensamiento latente

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La cadena de pensamiento (COT) provoca un razonamiento en modelos de lenguaje grande al generar explícitamente pasos intermedios en el lenguaje natural. En contraste, el pensamiento latente en los modelos en bucle funciona directamente en el espacio latente continuo, lo que permite el cálculo más allá de las representaciones lingüísticas discretas. Si bien ambos enfoques explotan el cálculo iterativo, sus capacidades comparativas siguen siendo subexploradas. En este trabajo, presentamos un análisis formal que muestra que el pensamiento latente en los transformadores en bucle permite el cálculo paralelo, que es más eficiente que el proceso inherentemente secuencial de COT. En contraste, COT aprovecha la decodificación estocástica a soluciones aproximadas a problemas donde el cálculo exacto es intratable. Estas separaciones sugieren las tareas para las cuales la recursión basada en la profundidad es más adecuada, ofreciendo así una guía práctica para elegir entre paradigmas de razonamiento. El código está disponible en esta URL HTTPS.

Publicado Originalme en export.arxiv.org El 30 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web