En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Zelo: método de entrenamiento inspirado en Elo para los vueltas y los modelos de incrustación

Zelo: método de entrenamiento inspirado en Elo para los vueltas y los modelos de incrustación

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Introducimos una nueva metodología de entrenamiento llamada Zelo, que optimiza el rendimiento de la recuperación a través del análisis de que las tareas de clasificación son estáticamente equivalentes a un modelo de Thurstone. Basado en el método Zelo, utilizamos datos no supervisados ​​para entrenar un conjunto de modelos de Reranker de peso abierto de última generación: Zerank-1 y Zerank-1-Small. Estos modelos alcanzan los puntajes de recuperación más altos en múltiples dominios, incluidas las finanzas, legal, código y STEM, superando a los volviéndose a relacionarios de código cerrado en NDCG@10 y recuperación. Estos modelos también demuestran una gran versatilidad, manteniendo su rendimiento de 0 disparos en conjuntos de datos de clientes fuera de dominio y privados. Los datos de capacitación incluyeron 112,000 consultas y 100 documentos por consulta, y recibieron capacitación de extremo a extremo de consultas y documentos no anotados en menos de 10,000 H100 horas.

Publicado Originalme en export.arxiv.org El 16 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web