Meta-optimización mejorada por la reflexión que integran la optimización de indica de estilo textgrad con autoevolución basada en la memoria

Resumen: Para abordar estas limitaciones, proponemos la meta-optimización mejorada por la reflexión (REMO), un marco novedoso que integra (1) un módulo de generación de recuperación de reflexión de reflexión de memoria de memoria (RAG), estructurado como un “cuaderno de error” y (2) un optimizador autoadaptativo, implementado a través de un meta-controlador de meta-controlador de meta-controlador de meta-controlador de los sintetselvelas de los sintets de los sintets de los syntalizaciones de los sintets de los syntalizaciones de los sintets de los sintets de los sintets de los sintets de los syntalizaciones de los sintets de los syntelates de los syntelizates. Mejorar las estrategias de solicitación a nivel del sistema. Esta arquitectura permite no solo un ajuste de inmediato local, de grano fino, similar a TextGrad, sino también la acumulación y reutilización sistemática del conocimiento de optimización cruzada, lo que respalda la mejora continua con el tiempo.
Instanciamos el marco REMO utilizando QWEN3-32B en el modo de inferencia estándar, sin la solicitud explícita de la cadena de pensamiento, y evaluamos su eficacia en el punto de referencia GSM8K para el razonamiento matemático. Los resultados experimentales demuestran que, en comparación con una línea de base TextGrad, Remo logra una generalización más estable y robusta, aunque a costa de un aumento de la sobrecarga computacional. Proporcionamos una exposición detallada del diseño algorítmico, realizamos un análisis cualitativo y cuantitativo de la dinámica de optimización y presentamos un estudio de ablación integral para dilucidar las contribuciones de cada componente.

Publicado Originalme en export.arxiv.org El 26 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Jornada Oportunidades en Industria en Horizonte Europa. Castilla y León

La descarga: el papel de las palomas en el desarrollo de la IA y las interpretaciones tecnológicas de los artistas nativos

standict.eu & aioti webinar “Conectando los puntos en el panorama de estándares de computación IoT y Edge en evolución”

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido