Resumen: Para evaluar este sistema interactivo frente a la ambigüedad y la inconsistencia del diálogo gerencial del mundo real, presentamos el Imitador Humano, un “gemelo digital” perfeccionado de un gerente racionalmente limitado que permite pruebas de estrés escalables y reproducibles. Nuestro análisis empírico revela que el marco agente híbrido reduce los costos totales de inventario en un 32,1% en relación con una línea de base interactiva que utiliza GPT-4o como solucionador de un extremo a otro. Además, descubrimos que proporcionar información perfecta sobre el terreno por sí sola es insuficiente para mejorar el rendimiento de GPT-4o, lo que confirma que el cuello de botella es fundamentalmente computacional más que informativo. Nuestros resultados posicionan a los LLM no como reemplazos de la investigación de operaciones, sino como interfaces de lenguaje natural que hacen que las políticas rigurosas basadas en solucionadores sean accesibles para los no expertos.
Publicado originalmente en export.arxiv.org el 4 de enero de 2026.
Ver fuente original
