Resumen: Incorporar modelos de lenguajes grandes (LLM) al despacho de transporte industrial como extractores de características semánticas en registros de comportamiento a escala de plataforma es un problema de sistemas de datos convincente pero poco explorado. Los canales de comparación de producción siguen dominados por características numéricas estructuradas, pero las señales de comportamiento decisivas (por ejemplo, la aversión habitual de un conductor a ciertas regiones) son inherentemente contextuales y naturalmente expresables como perfiles de usuario generados por LLM. Sin embargo, escalar dicho perfil a un despachador en vivo con latencia de milisegundos enfrenta tres limitaciones entrelazadas que rara vez se abordan juntas: en una plataforma con millones de pedidos diarios, los registros exceden la ventana de contexto de cualquier LLM en órdenes de magnitud; la mayoría de los usuarios son de cola larga, con muy pocas interacciones para la elaboración de perfiles por usuario; y los perfiles de fluidos superficiales no necesariamente mejoran la utilidad de predicción aguas abajo. Presentamos ProfiLLM, un canal de datos de LLM agente que pone en funcionamiento la creación de perfiles de usuarios alineados con las utilidades para sistemas de coincidencia de producción a través de dos módulos. (1) La minería de conocimiento global aumentada con herramientas equipa a un agente de LLM con 27 herramientas analíticas para extraer datos a escala de plataforma, produciendo conocimiento global reutilizable, reglas adaptables de agrupación de usuarios y antecedentes de oferta y demanda a nivel regional. (2) La exploración de perfiles alineados con la utilidad genera múltiples perfiles de candidatos por grupo, los evalúa a través de un proxy de utilidad descendente liviano, refina de manera iterativa los mejores candidatos y construye pares de preferencias para el ajuste fino de DPO. Implementado en el despachador de producción de DiDi, ProfiLLM logra una mejora relativa del AUC de hasta +6,14 % en la predicción de resultados, hasta un +4,35 % de ganancia de GMV en la simulación de despacho y mejoras consistentes en una prueba A/B en línea de 14 días que incluye +0,47 % de GMV, +0,33 % de tasa de finalización y -0,82 % de tasa de cancelación antes de aceptar.
Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original
