Zelo: método de entrenamiento inspirado en Elo para los vueltas y los modelos de incrustación

Resumen: Introducimos una nueva metodología de entrenamiento llamada Zelo, que optimiza el rendimiento de la recuperación a través del análisis de que las tareas de clasificación son estáticamente equivalentes a un modelo de Thurstone. Basado en el método Zelo, utilizamos datos no supervisados para entrenar un conjunto de modelos de Reranker de peso abierto de última generación: Zerank-1 y Zerank-1-Small. Estos modelos alcanzan los puntajes de recuperación más altos en múltiples dominios, incluidas las finanzas, legal, código y STEM, superando a los volviéndose a relacionarios de código cerrado en NDCG@10 y recuperación. Estos modelos también demuestran una gran versatilidad, manteniendo su rendimiento de 0 disparos en conjuntos de datos de clientes fuera de dominio y privados. Los datos de capacitación incluyeron 112,000 consultas y 100 documentos por consulta, y recibieron capacitación de extremo a extremo de consultas y documentos no anotados en menos de 10,000 H100 horas.

Publicado Originalme en export.arxiv.org El 16 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Alignkt: modelado explícitamente el estado de conocimiento para el rastreo de conocimiento con alineación de estado ideal

Cómo un thriller tecnológico de 30 años predijo nuestro aislamiento digital

Una revisión sistemática de vulnerabilidades de seguridad en dispositivos domésticos inteligentes y técnicas de mitigación

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido