Resumen: Los sistemas LLM deben tomar decisiones de control además de generar resultados: ya sea responder, aclarar, recuperar, llamar a herramientas, reparar o escalar. En muchas arquitecturas actuales, estas decisiones permanecen implícitas dentro de la generación, entrelazando la evaluación y la acción en una única llamada de modelo y haciendo que las fallas sean difíciles de inspeccionar, restringir o reparar. Proponemos un marco centrado en las decisiones que separa las señales relevantes para las decisiones de la política que las asigna a acciones, convirtiendo el control en una capa explícita e inspeccionable del sistema. Esta separación respalda la atribución de fallas en la estimación de señales, la política de decisiones o la ejecución, y permite la mejora modular de cada componente. Unifica configuraciones familiares de un solo paso, como el enrutamiento y la inferencia adaptativa, y se extiende naturalmente a configuraciones secuenciales en las que las acciones alteran la información disponible antes de actuar. A través de tres experimentos controlados, el marco reduce las acciones inútiles, mejora el éxito de las tareas y revela modos de falla interpretables. En términos más generales, ofrece un principio arquitectónico general para construir sistemas LLM más confiables, controlables y diagnosticables.
Publicado originalmente en export.arxiv.org el 1 de abril de 2026.
Ver fuente original
