Resumen: Los sistemas de múltiples agentes basados en modelos de lenguaje grande (LLM) han demostrado capacidades notables para abordar tareas compositivas complejas. En este trabajo, aplicamos este paradigma al problema de generación de papel ael, un proceso práctico pero que lleva mucho tiempo que enfrentan los investigadores que se preparan para conferencias. Si bien los enfoques recientes han intentado automatizar esta tarea, la mayoría descuidan el diseño del núcleo y los principios estéticos, lo que resulta en carteles que requieren un refinamiento manual sustancial. Para abordar estas limitaciones de diseño, proponemos Postergen, un marco de múltiples agentes que refleja el flujo de trabajo de los diseñadores de carteles profesionales. Consiste en cuatro agentes especializados colaborativos: (1) agentes de analizador y curador extraen contenido del documento y organizan el guión gráfico; (2) el agente de diseño mapea el contenido en un diseño espacial coherente; (3) Los agentes estilistas aplican elementos de diseño visual como color y tipografía; y (4) Renderizador compone el póster final. Juntos, estos agentes producen carteles que están semánticamente fundamentados y visualmente atractivos. Para evaluar la calidad del diseño, presentamos una rúbrica basada en el modelo de lenguaje de visión (VLM) que mide el equilibrio de diseño, la legibilidad y la coherencia estética. Los resultados experimentales muestran que Postergen coincide consistentemente en la fidelidad del contenido y supera significativamente los métodos existentes en los diseños visuales, generando carteles que están listos para la presentación con refinamientos humanos mínimos.
Publicado Originalme en export.arxiv.org El 25 de agosto de 2025.
Ver Fuente Original