Resumen: Los precios dinámicos basados en el riesgo pueden excluir sistemáticamente a los grupos de consumo vulnerables de los recursos esenciales como el seguro de salud y el crédito al consumidor. Mostramos que un regulador puede realinear incentivos privados con los objetivos sociales a través de un horario de impuestos apretable e interpretable. Primero, proporcionamos una proposición formal de que limitar la brecha demográfica de cada empresa limita implícitamente la disparidad de exclusión de cada empresa, motivando las sanciones a nivel de la empresa. Sobre la base de esta visión presentamos Texttt {MarketSim}: un simulador escalable de código abierto de los consumidores heterogéneos y las empresas que maximizan las ganancias, y capacitan a un planificador social de aprendizaje de refuerzo (RL) (SP) que selecciona un impacto de la justicia entre corchetes mientras retiene cerca de un simple prioridad lineal antes de un $ matemáticas {L} _1 $ regularidad. La política aprendida es, por lo tanto, transparente y fácilmente interpretable. En dos mercados calibrados empíricamente, es decir, el seguro de salud de los EE. UU. Y el crédito al consumidor, nuestro planificador aumenta simultáneamente la feria de la demanda en hasta $ 16 %$ en relación con el libre mercado no regulado al tiempo que supera un horario lineal fijo en términos de bienestar social sin coordinación explícita. Estos resultados ilustran cómo la regulación asistida por AI-AI puede convertir un dilema social competitivo en un equilibrio de ganar-ganar, proporcionando un marco de principios y práctico para la supervisión del mercado consciente de la equidad.
Publicado Originalme en rss.arxiv.org El 2 de junio de 2025.
Ver Fuente Original