En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->VeryTrace: verificación de rastros de razonamiento mediante formalismo compilable y verificación estructurada

VeryTrace: verificación de rastros de razonamiento mediante formalismo compilable y verificación estructurada

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: En tres dominios diversos: matemáticas de competencia (AIME 2025), planificación de robótica (LLM-BabyBench) y razonamiento de parentesco (CLUTRR), VeryTrace mejora la precisión sobre líneas de base de tiro cero en LLM de última generación sin requerir capacitación específica de dominio o ejemplos en contexto, lo que demuestra que la verificación de seguimiento formalizada logra precisión y generalización.

Publicado originalmente en export.arxiv.org el 23 de junio de 2026.
Ver fuente original

admin

Usuario de administración del sitio web