En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->DS-Star: Agente de ciencias de datos a través de la planificación y verificación iterativa

DS-Star: Agente de ciencias de datos a través de la planificación y verificación iterativa

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: la ciencia de datos, que transforma los datos sin procesar en ideas procesables, es crítica para la toma de decisiones basada en datos. Sin embargo, estas tareas a menudo son complejas, e implican pasos para explorar múltiples fuentes de datos y sintetizar hallazgos para ofrecer respuestas perspicaces. Si bien los modelos de idiomas grandes (LLM) muestran una promesa significativa en la automatización de este proceso, a menudo luchan con los formatos de datos heterogéneos y generan planes de análisis subóptimos, ya que verificar la suficiencia del plan es inherentemente difícil sin etiquetas de verdad en el suelo para tales tareas abiertas. Para superar estas limitaciones, presentamos DS-Star, un agente de ciencias de datos novedoso. Específicamente, DS-Star hace tres contribuciones clave: (1) un módulo de análisis de archivos de datos que explora y extrae automáticamente el contexto de diversos formatos de datos, incluidos los tipos no estructurados; (2) un paso de verificación donde un juez basado en LLM evalúa la suficiencia del plan de análisis en cada etapa; y (3) un mecanismo de planificación secuencial que comienza con un plan simple y ejecutable y lo refina iterativamente en función de la retroalimentación del DS-Star hasta que se verifica su suficiencia. Este refinamiento iterativo permite a DS-Star navegar de manera confiable de análisis complejos que involucran diversas fuentes de datos. Nuestros experimentos muestran que DS-Star logra un rendimiento de vanguardia en tres puntos de referencia desafiantes: Dabstep, Kramabench y DA-Code. Además, DS-Star supera particularmente las líneas de base en tareas difíciles que requieren procesar múltiples archivos de datos con formatos heterogéneos.

Publicado Originalme en export.arxiv.org El 28 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web