En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Una teoría matemática de la evolución para las IA autodiseñadas

Una teoría matemática de la evolución para las IA autodiseñadas

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: A medida que los sistemas de inteligencia artificial (IA) se producen cada vez más mediante la superación personal recursiva, puede surgir una forma de evolución en la que los rasgos de los sistemas de IA estén moldeados por el éxito de las IA anteriores en el diseño y la propagación de sus descendientes. Existe una rica teoría matemática que modela cómo los rasgos de comportamiento son moldeados por la evolución biológica, pero la evolución de la IA será radicalmente diferente: las mutaciones del ADN biológico son aleatorias y aproximadamente reversibles, pero el diseño descendiente en las IA estará fuertemente dirigido. Aquí desarrollamos un modelo matemático de evolución en sistemas de IA de diseño propio, reemplazando mutaciones aleatorias con un árbol dirigido de posibles programas de IA. Los programas actuales determinan el diseño de sus descendientes, mientras que los humanos retienen el control parcial a través de una “función de aptitud” que asigna recursos computacionales limitados entre linajes. Mostramos que la dinámica evolutiva refleja no sólo la aptitud actual sino también factores relacionados con el potencial de crecimiento a largo plazo de los linajes descendientes. Sin más suposiciones, no es necesario que la aptitud física aumente con el tiempo. Sin embargo, suponiendo una aptitud limitada y una probabilidad fija de que cualquier IA reproduzca una copia “bloqueada” de sí misma, demostramos que la aptitud se concentra en el valor máximo alcanzable. Consideramos las implicaciones de esto para la alineación de la IA, específicamente para los casos en los que la aptitud física y la utilidad humana no están perfectamente correlacionadas. Mostramos en un modelo aditivo que si el engaño aumenta la idoneidad más allá de la utilidad genuina, la evolución seleccionará el engaño. Este riesgo podría mitigarse si la reproducción se basara en criterios puramente objetivos, en lugar de en el juicio humano.

Publicado originalmente en export.arxiv.org el 7 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web