Resumen: Nuestras evaluaciones experimentales compararon CBA con un LLM listos para usar en varias consultas relacionadas con la privacidad/cumplimiento del mundo real dirigidos a varias personas. Descubrimos que CBA mejoró sustancialmente el rendimiento de Vanilla LLM en métricas como la tasa de coincidencia de palabras clave promedio (83.7% frente a 41.7%) y la tasa de aprobación de Judge LLM (82.0% frente a 20.0%). También comparamos las métricas para el diseño completo basado en el enrutamiento con los modos “ “ “ “ “ “ `agénicas` “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ “ iguales Este hallazgo validó nuestra hipótesis de que el mecanismo de enrutamiento conduce a una buena compensación entre los dos mundos.
Publicado Originalme en export.arxiv.org El 23 de julio de 2025.
Ver Fuente Original