En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Kimi-Dev: entrenamiento sin agente como habilidad previa para los agentes Swe

Kimi-Dev: entrenamiento sin agente como habilidad previa para los agentes Swe

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de idiomas grandes (LLM) se aplican cada vez más a la ingeniería de software (SWE), con SWE-Bench como un punto de referencia clave. Las soluciones se dividen en marcos de agentes SWE con interacciones múltiples y métodos sin agente basados ​​en flujo de trabajo con pasos verificables de giro único. Argumentamos que estos paradigmas no son mutuamente excluyentes: la capacitación sin agente intensiva de razonamiento induce antecedentes de habilidades, incluida la localización, la edición de código y la autorreflexión que permiten una adaptación eficiente y efectiva de SWE-agente. En este trabajo, primero seleccionamos la receta de entrenamiento sin agente y presentamos Kimi-Dev, un SWE LLM de código abierto que alcanza el 60,4 % en el banco SWE verificado, el mejor entre los enfoques de flujo de trabajo. Con una adaptación SFT adicional en 5k trayectorias disponibles públicamente, Kimi-Dev impulsa a los agentes a 48.6 % pase@1, a la par con la de Claude 3.5 Sonnet (versión 241022). Estos resultados muestran que los antecedentes de habilidades estructuradas de la capacitación sin agente pueden cerrar el flujo de trabajo y los marcos de agente para agentes de codificación transferibles.

Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web