ReVEL: Evolución heurística guiada por LLM reflexiva de múltiples giros a través de retroalimentación de desempeño estructurada

Resumen:Diseñar heurísticas efectivas para problemas de optimización combinatoria NP-difícil sigue siendo una tarea desafiante y que requiere mucha experiencia. Las aplicaciones existentes de modelos de lenguaje grandes (LLM) se basan principalmente en la síntesis de código de una sola vez, lo que produce heurísticas frágiles que subutilizan la capacidad de los modelos para el razonamiento iterativo. Proponemos ReVEL: Evolución heurística guiada por LLM reflexiva de múltiples turnos a través de retroalimentación de desempeño estructurada, un marco híbrido que incorpora los LLM como razonadores interactivos de múltiples turnos dentro de un algoritmo evolutivo (EA). El núcleo de ReVEL radica en dos mecanismos: (i) agrupación de perfiles de desempeño, que agrupa las heurísticas de los candidatos en grupos conductualmente coherentes para proporcionar retroalimentación compacta e informativa al LLM; y (ii) reflexión de múltiples turnos basada en retroalimentación, a través de la cual el LLM analiza comportamientos a nivel de grupo y genera refinamientos heurísticos específicos. Estas mejoras se integran y validan selectivamente mediante un metacontrolador basado en EA que equilibra de forma adaptativa la exploración y la explotación. Los experimentos con puntos de referencia de optimización combinatoria estándar muestran que ReVEL produce consistentemente heurísticas que son más sólidas y diversas, logrando mejoras estadísticamente significativas sobre líneas de base sólidas. Nuestros resultados destacan el razonamiento de múltiples turnos con agrupación estructurada como un paradigma de principios para el diseño heurístico automatizado.

Publicado originalmente en export.arxiv.org el 7 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Los piratas informáticos amenazaron de muerte a este investigador de seguridad. Gran error.

Tiempos brutales para la industria de baterías de EE. UU.

Evitando el cuello de botella de CSI: control espacial impulsado por MARL para conjuntos de reflectores

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido