Game-TARS: modelos básicos previamente entrenados para agentes de juegos multimodales generalistas escalables

Resumen:Presentamos Game-TARS, un agente de juego generalista entrenado con un espacio de acción unificado y escalable anclado a entradas nativas de teclado y mouse alineadas por humanos. A diferencia de los enfoques basados ​​en API o GUI, este paradigma permite un entrenamiento previo continuo a gran escala en dominios heterogéneos, incluidos sistemas operativos, web y juegos de simulación.

Leer más →

Comentarios desactivados en Game-TARS: modelos básicos previamente entrenados para agentes de juegos multimodales generalistas escalables

Aprender los cambios de movimiento individual después de las perturbaciones urbanas con dependencia de la infraestructura social

Resumen: Los cambios en los patrones de movimiento individuales después de eventos perturbadores pueden revelar demandas cambiantes de recursos comunitarios. Sin embargo, predecir esos cambios antes de que se produzcan acontecimientos perturbadores sigue siendo un desafío por varias razones.

Leer más →

Comentarios desactivados en Aprender los cambios de movimiento individual después de las perturbaciones urbanas con dependencia de la infraestructura social

El estimador de signos: alineación de LLM frente a la heterogeneidad de elección

Resumen: Los métodos tradicionales de alineación de LLM son vulnerables a la heterogeneidad en las preferencias humanas. Ajustar un modelo probabilístico ingenuo a datos de comparación por pares (por ejemplo, sobre pares de finalización rápida) produce una estimación inconsistente de la utilidad promedio de la población, una medida canónica del bienestar social.

Leer más →

Comentarios desactivados en El estimador de signos: alineación de LLM frente a la heterogeneidad de elección

Fin del contenido

No hay más páginas por cargar