Resumen: ¿Cuánta autonomía pueden mantener los sistemas LLM multiagente y qué lo permite? Presentamos un experimento computacional de 25.000 tareas que abarca 8 modelos, 4-256 agentes y 8 protocolos de coordinación que van desde la jerarquía impuesta externamente hasta la autoorganización emergente.
Leer más →
Resumen: Los sistemas actuales de investigación científica autónoma (ASR), a pesar de aprovechar grandes modelos de lenguaje (LLM) y arquitecturas agentes, siguen limitados por flujos de trabajo fijos y conjuntos de herramientas que impiden la adaptación a tareas y entornos en evolución.
Leer más →
Resumen:Asimilar la aritmética modular se ha establecido como el experimento con la mosca de la fruta por excelencia, y sirve como un dominio crítico para investigar los orígenes mecanicistas de la generalización de modelos.
Leer más →