Resumen:Presentamos Game-TARS, un agente de juego generalista entrenado con un espacio de acción unificado y escalable anclado a entradas nativas de teclado y mouse alineadas por humanos. A diferencia de los enfoques basados en API o GUI, este paradigma permite un entrenamiento previo continuo a gran escala en dominios heterogéneos, incluidos sistemas operativos, web y juegos de simulación.
Leer más →
Resumen: Los cambios en los patrones de movimiento individuales después de eventos perturbadores pueden revelar demandas cambiantes de recursos comunitarios. Sin embargo, predecir esos cambios antes de que se produzcan acontecimientos perturbadores sigue siendo un desafío por varias razones.
Leer más →
Resumen: Los métodos tradicionales de alineación de LLM son vulnerables a la heterogeneidad en las preferencias humanas. Ajustar un modelo probabilístico ingenuo a datos de comparación por pares (por ejemplo, sobre pares de finalización rápida) produce una estimación inconsistente de la utilidad promedio de la población, una medida canónica del bienestar social.
Leer más →