En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Meta-optimización mejorada por la reflexión que integran la optimización de indica de estilo textgrad con autoevolución basada en la memoria

Meta-optimización mejorada por la reflexión que integran la optimización de indica de estilo textgrad con autoevolución basada en la memoria

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Para abordar estas limitaciones, proponemos la meta-optimización mejorada por la reflexión (REMO), un marco novedoso que integra (1) un módulo de generación de recuperación de reflexión de reflexión de memoria de memoria (RAG), estructurado como un “cuaderno de error” y (2) un optimizador autoadaptativo, implementado a través de un meta-controlador de meta-controlador de meta-controlador de meta-controlador de los sintetselvelas de los sintets de los sintets de los syntalizaciones de los sintets de los syntalizaciones de los sintets de los sintets de los sintets de los sintets de los syntalizaciones de los sintets de los syntelates de los syntelizates. Mejorar las estrategias de solicitación a nivel del sistema. Esta arquitectura permite no solo un ajuste de inmediato local, de grano fino, similar a TextGrad, sino también la acumulación y reutilización sistemática del conocimiento de optimización cruzada, lo que respalda la mejora continua con el tiempo.
Instanciamos el marco REMO utilizando QWEN3-32B en el modo de inferencia estándar, sin la solicitud explícita de la cadena de pensamiento, y evaluamos su eficacia en el punto de referencia GSM8K para el razonamiento matemático. Los resultados experimentales demuestran que, en comparación con una línea de base TextGrad, Remo logra una generalización más estable y robusta, aunque a costa de un aumento de la sobrecarga computacional. Proporcionamos una exposición detallada del diseño algorítmico, realizamos un análisis cualitativo y cuantitativo de la dinámica de optimización y presentamos un estudio de ablación integral para dilucidar las contribuciones de cada componente.

Publicado Originalme en export.arxiv.org El 26 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web