En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Razonamiento matemático controlable mediante vectores de pensamiento autooptimizados

Razonamiento matemático controlable mediante vectores de pensamiento autooptimizados

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Presentamos un enfoque novedoso para el razonamiento matemático controlable que aprovecha los vectores de pensamiento autooptimizados con minimización de entropía. Nuestro método introduce vectores de pensamiento que se pueden aprender y que modulan dinámicamente el proceso de razonamiento interno de grandes modelos de lenguaje. Al utilizar Gemma-2-9B en GSM8K, logramos una precisión del 90,1 % con una puntuación de controlabilidad de 0,42, lo que demuestra que las recompensas basadas en entropía guían de manera efectiva patrones de razonamiento enfocados sin requerir anotaciones de recompensa externas. Nuestro análisis revela distintos grupos de vectores de pensamiento y distribuciones consistentes de baja entropía en todas las condiciones de control, lo que valida nuestro marco para el razonamiento de IA controlable.

Publicado originalmente en export.arxiv.org el 27 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web