En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Mejora de la diversidad y la viabilidad: síntesis poblacional conjunta a partir de datos de fuentes múltiples utilizando modelos generativos

Mejora de la diversidad y la viabilidad: síntesis poblacional conjunta a partir de datos de fuentes múltiples utilizando modelos generativos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Generar poblaciones sintéticas realistas es esencial para los modelos basados ​​en agentes (ABM) en transporte y planificación urbana. Los métodos actuales enfrentan dos limitaciones importantes. En primer lugar, muchos se basan en un único conjunto de datos o siguen un proceso secuencial de generación y fusión de datos, lo que significa que no logran capturar la compleja interacción entre las características. En segundo lugar, estos enfoques luchan con ceros de muestreo (combinaciones de atributos válidas pero no observadas) y ceros estructurales (combinaciones no factibles debido a restricciones lógicas), que reducen la diversidad y viabilidad de los datos generados. Este estudio propone un método novedoso para integrar y sintetizar simultáneamente conjuntos de datos de múltiples fuentes utilizando una Red Adversarial Generativa de Wasserstein (WGAN) con penalización de gradiente. Este método de aprendizaje conjunto mejora tanto la diversidad como la viabilidad de los datos sintéticos al definir un término de regularización (penalización de gradiente inverso) para la función de pérdida del generador. Para la evaluación, implementamos una métrica de evaluación unificada para la similitud y ponemos especial énfasis en medir la diversidad y la viabilidad a través del recuerdo, la precisión y la puntuación F1. Los resultados muestran que el enfoque conjunto propuesto supera la línea de base secuencial, con un aumento de la recuperación del 7% y de la precisión del 15%. Además, el plazo de regularización mejora aún más la diversidad y la viabilidad, lo que se refleja en un aumento del 10% en la recuperación y del 1% en la precisión. Evaluamos las distribuciones de similitud utilizando una puntuación de cinco métricas. El enfoque conjunto funciona mejor en general y alcanza una puntuación de 88,1 en comparación con 84,6 para el método secuencial. Dado que las poblaciones sintéticas sirven como un insumo clave para el ABM, este enfoque generativo de fuentes múltiples tiene el potencial de mejorar significativamente la precisión y confiabilidad del ABM.

Publicado originalmente en export.arxiv.org el 17 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web