POLARIS: planificación escrita y ejecución gobernada para IA agente en la automatización administrativa

Resumen: Los flujos de trabajo administrativos empresariales requieren sistemas de agentes que sean auditables, alineados con las políticas y operativamente predecibles, capacidades que las configuraciones genéricas de múltiples agentes a menudo no logran ofrecer. Presentamos POLARIS (Policy-Aware LLM Agentic Reasoning for Integrated Systems), un marco de orquestación gobernado que trata la automatización como síntesis de planes tipificados y ejecución validada sobre agentes LLM. Un planificador propone gráficos acíclicos dirigidos (DAG) estructuralmente diversos y con verificación de tipos, un módulo de razonamiento guiado por rúbricas selecciona un único plan compatible y la ejecución está protegida por comprobaciones cerradas del validador, un bucle de reparación limitado y barreras de seguridad de políticas compiladas que bloquean o encaminan los efectos secundarios antes de que ocurran. Aplicado a tareas financieras centradas en documentos, POLARIS produce artefactos de grado de decisión y seguimientos de ejecución completos al tiempo que reduce la intervención humana. Empíricamente, POLARIS logra un micro F1 de 0,81 en el conjunto de datos SROIE y, en un conjunto sintético controlado, logra una precisión de 0,95 a 1,00 para el enrutamiento de anomalías con pistas de auditoría preservadas. Estas evaluaciones constituyen un punto de referencia inicial para la IA Agentic gobernada. POLARIS proporciona una referencia metodológica y de referencia para la IA agente alineada con políticas. Palabras clave IA agente, automatización empresarial, tareas administrativas, puntos de referencia, gobernanza, planificación mecanografiada, evaluación

Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Insights basados ​​en datos para la toma de decisiones informadas: Aplicación de redes LSTM para un pronóstico de electricidad robusto en Libia

CausalReasoningBenchmark: un punto de referencia del mundo real para la evaluación separada de la identificación y estimación causal

Los OLED extensibles acaban de recibir una gran actualización

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido

Insights basados en datos para la toma de decisiones informadas: Aplicación de redes LSTM para un pronóstico de electricidad robusto en Libia