
La nueva especificación, respaldada por las principales organizaciones miembros de LF AI & Data, IBM y Red Hat, así como otras organizaciones, incluida ABBYY, complementa el proyecto de código abierto Docling. “NVIDIA espera trabajar con la Fundación Linux y el ecosistema DocLang más amplio para acelerar la adopción de este formato de documento nativo de IA en todas las industrias”, dijo Kari Briski, vicepresidente de IA generativa de NVIDIA.
Hoy en día, las empresas trabajan en un panorama fragmentado de formatos de documentos, incluidos PDF, JPEG y otros tipos de archivos creados principalmente para el consumo humano en lugar de la interpretación de IA. A medida que las organizaciones dependen cada vez más de la IA generativa y los sistemas agentes, esta desconexión puede introducir complejidad, aumentar los costos y reducir la confiabilidad al extraer significado de los documentos comerciales.
“DocLang está diseñado para resolver uno de los problemas fundamentales de la IA empresarial: los documentos se crearon para humanos, no para máquinas”, afirmó Maxime Vermeir, vicepresidente de estrategia de IA de ABBYY. “Al introducir una representación mínima, estandarizada y nativa de IA de la estructura, el diseño, el significado y la gobernanza del documento, DocLang crea una base mucho más determinista para los sistemas de IA modernos. Esto da como resultado una capa de contexto nativa de IA a escala”.
DocLang está diseñado para soportar:
Preservación tanto del significado semántico como del diseño geométrico en un único formato nativo de IA
Representación de elementos estructurales como títulos, párrafos y tablas junto con su posición en la página.
Controles de gobernanza integrados para ayudar a los sistemas posteriores a aplicar políticas relacionadas con la privacidad, el alcance de la extracción y los permisos de capacitación del modelo.
Optimización de enfoques modernos de tokenización y modelado de IA para respaldar una comprensión de documentos más eficiente y confiable.
DocLang y Docling
El nuevo grupo de trabajo aprovecha el impulso de Docling, el conjunto de herramientas de procesamiento de documentos de código abierto alojado por LF AI & Data. Docling, desarrollado originalmente por el equipo de IA para el conocimiento de IBM Research Zurich y lanzado como código abierto en 2024, se ha convertido en un proyecto ampliamente adoptado para convertir documentos en representaciones estructuradas y listas para IA.
Docling sirve como capa de procesamiento y conversión, incorporando una variedad de formatos de documentos (incluidos .pdf, .docx, .pptx, .xlsx, HTML e imágenes) y transformándolos en resultados estructurados utilizando modelos avanzados para el análisis de diseño y la comprensión de tablas. Su representación interna, DoclingDocument, captura texto, tablas, figuras, orden de lectura y diseño en un formato ricamente estructurado.
DocLang complementa esa base definiendo un estándar abierto e interoperable para expresar e intercambiar esa salida estructurada entre sistemas. Juntos, Docling y DocLang crean una pila de IA de documentos de código abierto más completa bajo LF AI & Data, que abarca la ingesta, el análisis, la representación estandarizada y el consumo posterior de documentos mediante modelos de lenguaje y sistemas de IA agentes.
Obtenga más información y participe
Las organizaciones y contribuyentes individuales interesados en ayudar a dar forma al futuro del procesamiento de documentos con IA están invitados a participar en el Grupo de Trabajo DocLang. La membresía está abierta a organizaciones comprometidas con la construcción de una infraestructura de IA abierta e interoperable.
Para obtener más información, adoptar el estándar o contribuir a la especificación DocLang, visite https://doclang.ai/.
Publicado originalmente en linuxfoundation.org el 9 de junio de 2026.
Ver fuente original
