En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->CUBE: Un estándar para los puntos de referencia de los agentes unificadores

CUBE: Un estándar para los puntos de referencia de los agentes unificadores

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:La proliferación de puntos de referencia de agentes ha creado una fragmentación crítica que amenaza la productividad de la investigación. Cada nuevo punto de referencia requiere una integración personalizada sustancial, lo que crea un “impuesto de integración” que limita la evaluación integral. Proponemos CUBE (Entornos de referencia unificados comunes), un estándar de protocolo universal basado en MCP y Gym que permite que los puntos de referencia se incluyan una vez y se utilicen en todas partes. Al separar las tareas, los puntos de referencia, los paquetes y los registros en distintas capas API, CUBE permite que cualquier plataforma compatible acceda a cualquier punto de referencia compatible para evaluación, capacitación de RL o generación de datos sin integración personalizada. Hacemos un llamado a la comunidad para que contribuya al desarrollo de este estándar antes de que las implementaciones específicas de plataformas profundicen la fragmentación a medida que la producción de referencia se acelere hasta 2026.

Publicado originalmente en export.arxiv.org el 17 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web