Resumen:Embodied Question Answering (EQA) requiere que los agentes exploren entornos 3D para obtener observaciones y responder preguntas relacionadas con la escena.
Leer más →
Resumen: Los agentes web autónomos impulsados por grandes modelos de lenguaje (LLM) muestran un gran potencial para realizar tareas orientadas a objetivos, como la recuperación de información, la generación de informes y las transacciones en línea. Estos agentes marcan un paso clave hacia el razonamiento incorporado práctico en entornos web abiertos.
Leer más →
Resumen:La previsión de la movilidad humana es crucial para la ayuda en caso de desastres, la planificación urbana y la salud pública. Sin embargo, los modelos existentes solo modelan secuencias de ubicación o incluyen información temporal simplemente como entrada auxiliar, por lo que no logran aprovechar el rico contexto semántico proporcionado por los puntos de interés (POI).
Leer más →