Resumen: Los modelos de transformadores profundos sobresalen en la clasificación de texto de etiquetas múltiples, pero a menudo violan la lógica de dominio que los expertos consideran esencial, un tema de particular preocupación en aplicaciones críticas para la seguridad. Proponemos un marco neurosimbólico híbrido que integra la programación de conjuntos de respuestas (ASP) con el aprendizaje basado en transformadores en el corpus del Sistema de informes de seguridad de la aviación (ASRS). El conocimiento del dominio se formaliza como reglas ASP ponderadas y se valida mediante el solucionador Clingo. Estas reglas se incorporan de dos maneras complementarias: (i) como aumento de datos basado en reglas, generando muestras sintéticas lógicamente consistentes que mejoran la diversidad y cobertura de las etiquetas; y (ii) como regularizador de lógica difusa, que impone la satisfacción de reglas en una forma diferenciable durante el ajuste fino. Este diseño preserva la interpretabilidad del razonamiento simbólico al tiempo que aprovecha la escalabilidad de las arquitecturas neuronales profundas. Ajustamos aún más los umbrales por clase e informamos tanto de las métricas de clasificación estándar como de las tasas de coherencia lógica. En comparación con una base de referencia sólida de entropía cruzada binaria (BCE), nuestro enfoque mejora las puntuaciones micro y macro-F1 y logra una reducción de hasta un 86 % en las infracciones de reglas en el conjunto de pruebas ASRS. Hasta donde sabemos, esto constituye la primera aplicación neurosimbólica a gran escala de los informes ASRS que unifica el razonamiento basado en ASP, el aumento basado en reglas y el entrenamiento transformador diferenciable para una PNL confiable y crítica para la seguridad.
Publicado originalmente en export.arxiv.org el 7 de octubre de 2025.
Ver fuente original