PreferThinker: Evaluación personalizada de preferencias de imágenes basada en el razonamiento

Resumen: La evaluación personalizada de preferencias de imágenes tiene como objetivo evaluar las preferencias de imágenes de un usuario individual basándose únicamente en un pequeño conjunto de imágenes de referencia como información previa.

Leer más →

Comentarios desactivados en PreferThinker: Evaluación personalizada de preferencias de imágenes basada en el razonamiento

Modelo de aprendizaje por refuerzo de agente único para el control regional adaptativo de señales de tráfico

Resumen:Varios estudios han empleado el aprendizaje por refuerzo (RL) para abordar los desafíos del control regional adaptativo de señales de tráfico (ATSC) y han logrado resultados prometedores. En este campo, la investigación existente adopta predominantemente marcos de múltiples agentes. Sin embargo, la adopción de marcos multiagente presenta desafíos para la escalabilidad.

Leer más →

Comentarios desactivados en Modelo de aprendizaje por refuerzo de agente único para el control regional adaptativo de señales de tráfico

Fin del contenido

No hay más páginas por cargar