Resumen: La ingeniería rápida representa un cuello de botella crítico para aprovechar todo el potencial de los modelos de idiomas grandes (LLM) para resolver tareas complejas, ya que requiere experiencia especializada, prueba y error significativo e intervención manual. Este desafío es particularmente pronunciado para las tareas que involucran una evaluación de calidad subjetiva, donde definir los objetivos de optimización explícitos se vuelve fundamentalmente problemático. Los métodos de optimización de inmediato automatizados existentes falsan en estos escenarios, ya que generalmente requieren funciones de aptitud numérica específica de tareas bien definidas o confían en plantillas genéricas que no pueden capturar los requisitos matizados de casos de uso complejos. Introducimos a Deevo (optimización de inmediato evolutiva impulsada por el debate), un marco novedoso que guía una evolución rápida a través de una evaluación basada en debate con una selección basada en ELO. Contrariamente al trabajo previo, el enfoque devos permite la exploración del espacio de inmediato discreto al tiempo que preserva la coherencia semántica a través de operaciones inteligentes de cruce y mutación estratégica que incorporan comentarios basados en debates, combinando elementos de indicaciones exitosas y no exitosas basadas en fortalezas identificadas en lugar de empalmes arbitrarias. Utilizando las calificaciones ELO como un proxy de fitness, DeEvo impulsa simultáneamente la mejora y preserva la valiosa diversidad en la rápida población. Los resultados experimentales demuestran que DeEVO supera significativamente los enfoques de optimización de estado de estado de estado de estado manual y de la optimización alternativa en tareas abiertas y tareas cerradas a pesar de no usar comentarios de verdad fundamentales. Al conectar las capacidades de razonamiento de LLMS con la optimización adaptativa, DeEvo representa un avance significativo en la investigación de optimización rápida al eliminar la necesidad de métricas predeterminadas para mejorar continuamente los sistemas de IA.
Publicado Originalme en rss.arxiv.org El 2 de junio de 2025.
Ver Fuente Original