Resumen:La alineación tradicional de la IA se centra principalmente en los resultados de los modelos individuales; sin embargo, los agentes autónomos en flujos de trabajo a largo plazo requieren una confiabilidad sostenida en todas las trayectorias de interacción. Presentamos APEMO (Modulación de extremo de pico consciente de los efectos para orquestación), una capa de programación en tiempo de ejecución que optimiza la asignación computacional bajo presupuestos fijos al operacionalizar señales afectivas temporales. En lugar de modificar los pesos del modelo, APEMO detecta la inestabilidad de la trayectoria a través de indicadores de comportamiento y apunta a reparaciones en segmentos críticos, como momentos pico y finales. La evaluación de simulaciones de múltiples agentes y flujos de planificador-ejecutor basados en LLM demuestra que APEMO mejora consistentemente la calidad a nivel de trayectoria y la probabilidad de reutilización sobre los orquestadores estructurales. Nuestros resultados replantean la alineación como un problema de control temporal, ofreciendo una vía de ingeniería resiliente para el desarrollo de sistemas agentes de largo horizonte.
Publicado originalmente en export.arxiv.org el 22 de febrero de 2026.
Ver fuente original
