Resumen: La forma en que pensamos sobre la IA generativa en este momento es fundamentalmente individual. Vemos esto no sólo en cómo los usuarios interactúan con los modelos, sino también en cómo se construyen los modelos, cómo se comparan y cómo se definen las estrategias comerciales y de investigación que utilizan la IA.
Leer más →
Resumen: La evaluación confiable de los agentes de IA que operan en entornos complejos del mundo real requiere metodologías que sean sólidas, transparentes y contextualmente alineadas con las tareas que los agentes deben realizar.
Leer más →
Resumen: ¿Cuánta autonomía pueden mantener los sistemas LLM multiagente y qué lo permite? Presentamos un experimento computacional de 25.000 tareas que abarca 8 modelos, 4-256 agentes y 8 protocolos de coordinación que van desde la jerarquía impuesta externamente hasta la autoorganización emergente.
Leer más →