Resumen: Los agentes automatizados de IA son cada vez más capaces, pero muchas tareas científicas y profesionales requieren juicio humano y experiencia contextual. Estudiamos equipos humanos-IA en espacios de trabajo compartidos, donde los agentes de IA y los colaboradores humanos deben coordinar responsabilidades antes de enviar una respuesta final. Al utilizar el entorno de Collaborative Gym con tareas de DiscoveryBench, examinamos cuándo agregar colaboradores humanos simulados mejora el rendimiento y cuándo la pérdida de procesos convierte a colaboradores adicionales en gastos generales de coordinación. En 1482 sesiones, agregar colaboradores relevantes puede reducir el rendimiento cuando los equipos carecen de estructura para coordinar sus contribuciones. Luego evaluamos el andamiaje que combina la memoria grupal compartida con puertas simuladas de humano en el circuito (HITL), donde las acciones seleccionadas requieren la aprobación de un participante simulado designado. Este andamiaje produce un desempeño medio más alto, más claramente en equipos de tres personas, con señales de responsabilidad más claras y una ruta más fuerte de la experiencia hacia las acciones del equipo. En general, la forma en que los equipos humanos-IA coordinan e integran la experiencia es tan importante como la capacidad disponible para ellos.
Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original
