Resumen:Garantizar la coherencia de la identidad de los personajes en las distintas indicaciones sigue siendo una limitación fundamental en la generación de texto a imagen basada en difusión.
Leer más →
Resumen: El razonamiento abductivo multimodal (la generación y selección de hipótesis explicativas a partir de observaciones parciales) es una piedra angular de la inteligencia. Las evaluaciones actuales de esta capacidad en modelos de visión y lenguaje (VLM) se limitan en gran medida a tareas estáticas de un solo agente.
Leer más →
Resumen: La gestión eficaz de incidentes en sistemas de TI a gran escala se basa en guías de resolución de problemas (TSG), pero su ejecución manual es lenta y propensa a errores.
Leer más →