Resumen: Introducimos una nueva metodología de entrenamiento llamada Zelo, que optimiza el rendimiento de la recuperación a través del análisis de que las tareas de clasificación son estáticamente equivalentes a un modelo de Thurstone. Basado en el método Zelo, utilizamos datos no supervisados para entrenar un conjunto de modelos de Reranker de peso abierto de última generación: Zerank-1 y Zerank-1-Small. Estos modelos alcanzan los puntajes de recuperación más altos en múltiples dominios, incluidas las finanzas, legal, código y STEM, superando a los volviéndose a relacionarios de código cerrado en NDCG@10 y recuperación. Estos modelos también demuestran una gran versatilidad, manteniendo su rendimiento de 0 disparos en conjuntos de datos de clientes fuera de dominio y privados. Los datos de capacitación incluyeron 112,000 consultas y 100 documentos por consulta, y recibieron capacitación de extremo a extremo de consultas y documentos no anotados en menos de 10,000 H100 horas.
Publicado Originalme en export.arxiv.org El 16 de septiembre de 2025.
Ver Fuente Original