Kimi-Dev: entrenamiento sin agente como habilidad previa para los agentes Swe

Resumen: Los modelos de idiomas grandes (LLM) se aplican cada vez más a la ingeniería de software (SWE), con SWE-Bench como un punto de referencia clave. Las soluciones se dividen en marcos de agentes SWE con interacciones múltiples y métodos sin agente basados en flujo de trabajo con pasos verificables de giro único. Argumentamos que estos paradigmas no son mutuamente excluyentes: la capacitación sin agente intensiva de razonamiento induce antecedentes de habilidades, incluida la localización, la edición de código y la autorreflexión que permiten una adaptación eficiente y efectiva de SWE-agente. En este trabajo, primero seleccionamos la receta de entrenamiento sin agente y presentamos Kimi-Dev, un SWE LLM de código abierto que alcanza el 60,4 % en el banco SWE verificado, el mejor entre los enfoques de flujo de trabajo. Con una adaptación SFT adicional en 5k trayectorias disponibles públicamente, Kimi-Dev impulsa a los agentes a 48.6 % pase@1, a la par con la de Claude 3.5 Sonnet (versión 241022). Estos resultados muestran que los antecedentes de habilidades estructuradas de la capacitación sin agente pueden cerrar el flujo de trabajo y los marcos de agente para agentes de codificación transferibles.

Publicado Originalme en export.arxiv.org El 29 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Difusión planificada

CHAT2SPAT: una herramienta basada en modelos de lenguaje grande para automatizar la gestión del plan de control de señales de tráfico

LM Fight Arena: Evaluación comparativa de grandes modelos multimodales a través de la competencia de juegos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido