Resumen: Los flujos de trabajo administrativos empresariales requieren sistemas de agentes que sean auditables, alineados con las políticas y operativamente predecibles, capacidades que las configuraciones genéricas de múltiples agentes a menudo no logran ofrecer. Presentamos POLARIS (Policy-Aware LLM Agentic Reasoning for Integrated Systems), un marco de orquestación gobernado que trata la automatización como síntesis de planes tipificados y ejecución validada sobre agentes LLM. Un planificador propone gráficos acíclicos dirigidos (DAG) estructuralmente diversos y con verificación de tipos, un módulo de razonamiento guiado por rúbricas selecciona un único plan compatible y la ejecución está protegida por comprobaciones cerradas del validador, un bucle de reparación limitado y barreras de seguridad de políticas compiladas que bloquean o encaminan los efectos secundarios antes de que ocurran. Aplicado a tareas financieras centradas en documentos, POLARIS produce artefactos de grado de decisión y seguimientos de ejecución completos al tiempo que reduce la intervención humana. Empíricamente, POLARIS logra un micro F1 de 0,81 en el conjunto de datos SROIE y, en un conjunto sintético controlado, logra una precisión de 0,95 a 1,00 para el enrutamiento de anomalías con pistas de auditoría preservadas. Estas evaluaciones constituyen un punto de referencia inicial para la IA Agentic gobernada. POLARIS proporciona una referencia metodológica y de referencia para la IA agente alineada con políticas. Palabras clave IA agente, automatización empresarial, tareas administrativas, puntos de referencia, gobernanza, planificación mecanografiada, evaluación
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
