En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->ReVEL: Evolución heurística guiada por LLM reflexiva de múltiples giros a través de retroalimentación de desempeño estructurada

ReVEL: Evolución heurística guiada por LLM reflexiva de múltiples giros a través de retroalimentación de desempeño estructurada

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Diseñar heurísticas efectivas para problemas de optimización combinatoria NP-difícil sigue siendo una tarea desafiante y que requiere mucha experiencia. Las aplicaciones existentes de modelos de lenguaje grandes (LLM) se basan principalmente en la síntesis de código de una sola vez, lo que produce heurísticas frágiles que subutilizan la capacidad de los modelos para el razonamiento iterativo. Proponemos ReVEL: Evolución heurística guiada por LLM reflexiva de múltiples turnos a través de retroalimentación de desempeño estructurada, un marco híbrido que incorpora los LLM como razonadores interactivos de múltiples turnos dentro de un algoritmo evolutivo (EA). El núcleo de ReVEL radica en dos mecanismos: (i) agrupación de perfiles de desempeño, que agrupa las heurísticas de los candidatos en grupos conductualmente coherentes para proporcionar retroalimentación compacta e informativa al LLM; y (ii) reflexión de múltiples turnos basada en retroalimentación, a través de la cual el LLM analiza comportamientos a nivel de grupo y genera refinamientos heurísticos específicos. Estas mejoras se integran y validan selectivamente mediante un metacontrolador basado en EA que equilibra de forma adaptativa la exploración y la explotación. Los experimentos con puntos de referencia de optimización combinatoria estándar muestran que ReVEL produce consistentemente heurísticas que son más sólidas y diversas, logrando mejoras estadísticamente significativas sobre líneas de base sólidas. Nuestros resultados destacan el razonamiento de múltiples turnos con agrupación estructurada como un paradigma de principios para el diseño heurístico automatizado.

Publicado originalmente en export.arxiv.org el 7 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web