Resumen: La creación de taxonomía de ocupación sólidas, vital para aplicaciones que van desde la recomendación de trabajo hasta la inteligencia del mercado laboral, es un desafío. La curación manual es lenta, mientras que los métodos automatizados existentes no se adaptan a los mercados regionales dinámicos (de arriba hacia abajo) o luchan por construir jerarquías coherentes a partir de datos ruidosos (de abajo hacia arriba). Introducimos a Climb (constructor de taxonomía de agentes múltiples basados en agrupación), un marco que automatiza completamente la creación de taxonomías de alta calidad y basadas en datos a partir de las publicaciones de trabajo sin procesar. Climb utiliza la agrupación semántica global para destilar las ocupaciones centrales, luego emplea un sistema de agente múltiple basado en la reflexión para construir iterativamente una jerarquía coherente. En tres conjuntos de datos diversos del mundo real, mostramos que la escalada produce taxonomías que son más coherentes y escalables que los métodos existentes y capturan con éxito características regionales únicas. Lanzamos nuestro código y conjuntos de datos en esta URL HTTPS.
Publicado Originalme en export.arxiv.org El 21 de septiembre de 2025.
Ver Fuente Original