Resumen: Los conjuntos de datos existentes para la comprensión de tablas multimodales, como MMTab, proporcionan principalmente respuestas breves y fácticas sin una supervisión explícita del razonamiento de varios pasos.
Leer más →
Resumen: Los modelos de recomendación secuencial se utilizan ampliamente en aplicaciones, pero enfrentan estrictos requisitos de latencia. Los modelos convencionales aprovechan el mecanismo de atención de Transformer para mejorar el rendimiento, pero su complejidad computacional crece con la longitud de la secuencia, lo que genera un desafío de latencia para secuencias largas.
Leer más →
Resumen:La extracción automática de flujos de trabajo como gráficos de procedimientos a partir del lenguaje natural es prometedora pero poco explorada y exige tanto validez estructural como alineación lógica.
Leer más →