¿Los agentes artificiales perseguirán el poder por defecto?

Resumen: Los investigadores preocupados por los riesgos catastróficos de la IA avanzada han argumentado que debemos esperar que los agentes de IA suficientemente capaces persigan el poder sobre la humanidad porque el poder es un objetivo instrumental convergente, algo que es útil para una amplia gama de objetivos finales. Otros han expresado recientemente escepticismo de estas afirmaciones. Este documento tiene como objetivo formalizar los conceptos de convergencia instrumental y la búsqueda de poder en un marco abstracto y teórico de decisión, y evaluar la afirmación de que el poder es un objetivo instrumental convergente. Concluyo que esta afirmación contiene al menos un elemento de la verdad, pero podría resultar tener una utilidad predictiva limitada, ya que las opciones de un agente no siempre se pueden clasificar en términos de poder en ausencia de información sustantiva sobre los objetivos finales del agente. Sin embargo, el hecho de la convergencia instrumental es más predictivo para los agentes que tienen una buena oportunidad de alcanzar el poder absoluto o casi absoluto.

Publicado Originalme en rss.arxiv.org El 9 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

PathWise: planificación a través del modelo mundial para el diseño heurístico automatizado a través de LLM autoevolutivos

El imperativo teórico de la información: la compresión y los fundamentos epistémicos de la inteligencia

Selección escalable de grupos de actividades guiadas hasta el punto de inflexión en programación genética de múltiples árboles para la programación dinámica de proyectos multimodo

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido