En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->SHEAMDESILDER: Generación de diseño de hoja de cálculo con alimentación de MLLM con reflexión basada en reglas y visión

SHEAMDESILDER: Generación de diseño de hoja de cálculo con alimentación de MLLM con reflexión basada en reglas y visión

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Las hojas de cálculo son críticas para las tareas centradas en los datos, con diseños ricos y estructurados que permiten la transmisión de información eficiente. Dado el tiempo y la experiencia requeridos para el diseño manual de diseño de hoja de cálculo, existe una necesidad urgente de soluciones automatizadas. Sin embargo, los modelos de diseño automatizado existentes no tienen adecuados a las hojas de cálculo, ya que a menudo (1) tratan los componentes como rectángulos alineados con el eje con coordenadas continuas, con vistas a la estructura inherentemente discreta basada en la cuadrícula de hojas de cálculo; y (2) descuidar la semántica interrelacionada, como las dependencias de datos y los enlaces contextuales, exclusivos de las hojas de cálculo. En este documento, primero formalizamos la tarea de generación de diseño de hoja de cálculo, compatible con un protocolo de evaluación de siete criterios y un conjunto de datos de 3.326 hojas de cálculo. Luego presentamos SheetDesigner, un marco sin capacitación cero y sin capacitación utilizando modelos de lenguaje grande multimodal (MLLMS) que combina la reflexión de reglas y visión para la colocación de componentes y la población de contenido. SheetDesigner supera a cinco líneas de base en al menos 22.6 %. Además, encontramos que a través de la modalidad de visión, los MLLM manejan la superposición y el equilibrio bien, pero luchan con la alineación, requiere estrategias de reflexión híbrida de reglas y reflexión visual. Nuestros códigos y datos están disponibles en GitHub.

Publicado Originalme en export.arxiv.org El 9 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web