AgentComm-Bench: IA incorporada cooperativa para pruebas de estrés bajo latencia, pérdida de paquetes y colapso del ancho de banda

Resumen: Los métodos cooperativos de múltiples agentes para la IA incorporada se evalúan casi universalmente bajo comunicación idealizada: latencia cero, sin pérdida de paquetes y ancho de banda ilimitado. El despliegue en el mundo real de robots con enlaces inalámbricos, vehículos autónomos en redes congestionadas o enjambres de drones en espectros en disputa no ofrece tales garantías.

Leer más →

Comentarios desactivados en AgentComm-Bench: IA incorporada cooperativa para pruebas de estrés bajo latencia, pérdida de paquetes y colapso del ancho de banda

Yo, yo mismo y $pi$: evaluación y explicación de la introspección del LLM

Resumen:Un sello distintivo de la inteligencia humana es la introspección: la capacidad de evaluar y razonar sobre los propios procesos cognitivos. La introspección ha surgido como una capacidad prometedora pero controvertida en los modelos de lenguajes grandes (LLM).

Leer más →

Comentarios desactivados en Yo, yo mismo y $pi$: evaluación y explicación de la introspección del LLM

FactorSmith: Generación de simulación agente mediante la descomposición del proceso de decisión de Markov con refinamiento del planificador-diseñador-crítico

Resumen:Generar simulaciones ejecutables a partir de especificaciones de lenguaje natural sigue siendo un problema desafiante debido a la limitada capacidad de razonamiento de los grandes modelos de lenguaje (LLM) cuando se enfrentan a bases de código grandes e interconectadas.

Leer más →

Comentarios desactivados en FactorSmith: Generación de simulación agente mediante la descomposición del proceso de decisión de Markov con refinamiento del planificador-diseñador-crítico

Fin del contenido

No hay más páginas por cargar