Adalog: detección adaptativa de anomalías no supervisadas en registros con modelo de lenguaje enmascarado de autoatición

Resumen: Los sistemas de software modernos generan datos de registro heterogéneos extensos con formatos dinámicos, secuencias de eventos fragmentados y patrones temporales variables, lo que hace que la detección de anomalías sea crucial y desafiante. Para abordar estas complejidades, proponemos Adalog, un marco de detección de anomalías adaptativo y no supervisado diseñado para aplicabilidad práctica en diversos entornos del mundo real. A diferencia de los métodos tradicionales que dependen del análisis de registros, dependencias de secuencia estrictas o datos etiquetados, Adalog opera en registros individuales no estructurados, extrae relaciones contextuales intra-log y realiza un umbral adaptativo en datos normales. El enfoque propuesto utiliza un codificador bidireccional previamente basado en transformadores con una tarea de modelado de lenguaje enmascarado, ajustado en registros normales para capturar patrones sintácticos y semánticos específicos de dominio esenciales para una detección de anomalías precisa. Las anomalías se identifican a través de probabilidades de reconstrucción a nivel de token, agregadas en puntajes a nivel de registro, con umbral basado en percentiles adaptativos calibrados solo en datos normales. Esto permite que el modelo se adapte dinámicamente a los comportamientos del sistema en evolución al tiempo que evita los umbrales rígidos basados en la heurística comunes en los sistemas tradicionales. Evaluamos el adalo en los conjuntos de datos de referencia BGL, Thunderbird y Spirit, que muestra una fuerte generalización y un rendimiento competitivo en comparación con los métodos supervisados de vanguardia y no supervisados. Estudios de ablación adicionales examinan los efectos del enmascaramiento, el ajuste fino y el posicionamiento de tokens en el comportamiento del modelo e interpretabilidad.

Publicado Originalme en rss.arxiv.org El 20 de mayo de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

¿Puede la geopolítica desbloquear los materiales críticos del cofre del tesoro de Groenlandia?

Nuevas Convocatorias de Horizonte Europa EN 2025 – Clúster 4 Digital E Industria

El módulo de política de IA: Desarrollo de la competencia de los estudiantes de ciencias de la computación en ética y política de IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido