Agentes autónomos de IA para la cobertura de opciones: mejorar la estabilidad financiera mediante el aprendizaje por refuerzo consciente del déficit

Resumen:El despliegue de agentes autónomos de IA en los mercados de derivados ha ampliado una brecha práctica entre la calibración del modelo estático y los resultados de cobertura obtenidos. Presentamos dos marcos de aprendizaje por refuerzo, un novedoso enfoque de aprendizaje por replicación de precios de opciones (RLOP) y una extensión adaptativa de Q-learner en Black-Scholes (QLBS), que priorizan la probabilidad de déficit y alinean los objetivos de aprendizaje con una cobertura sensible a las desventajas. Utilizando las opciones SPY y XOP listadas, evaluamos modelos utilizando distribuciones de resultados de cobertura delta de trayectoria realizada, probabilidad de déficit y medidas de riesgo de cola, como el déficit esperado. Empíricamente, RLOP reduce la frecuencia de déficit en la mayoría de los sectores y muestra las mejoras más claras del riesgo de cola en estrés, mientras que el ajuste de volatilidad implícita a menudo favorece los modelos paramétricos pero predice mal el desempeño de la cobertura después de costos. Este marco de RL consciente de la fricción respalda un enfoque práctico para la gestión autónoma del riesgo de derivados a medida que los sistemas de negociación mejorados por IA escalan.

Publicado originalmente en export.arxiv.org el 9 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Rainbow Padding: mitigación de la terminación anticipada en LLM de difusión adaptada a la instrucción

El primer examen del científicos: sondeo de habilidades cognitivas de MLLM a través de la percepción, la comprensión y el razonamiento

Entrenamiento del subgrupo fantasma: ataques sigilosos contra sistemas de recomendación federados

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido