En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Adalog: detección adaptativa de anomalías no supervisadas en registros con modelo de lenguaje enmascarado de autoatición

Adalog: detección adaptativa de anomalías no supervisadas en registros con modelo de lenguaje enmascarado de autoatición

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de software modernos generan datos de registro heterogéneos extensos con formatos dinámicos, secuencias de eventos fragmentados y patrones temporales variables, lo que hace que la detección de anomalías sea crucial y desafiante. Para abordar estas complejidades, proponemos Adalog, un marco de detección de anomalías adaptativo y no supervisado diseñado para aplicabilidad práctica en diversos entornos del mundo real. A diferencia de los métodos tradicionales que dependen del análisis de registros, dependencias de secuencia estrictas o datos etiquetados, Adalog opera en registros individuales no estructurados, extrae relaciones contextuales intra-log y realiza un umbral adaptativo en datos normales. El enfoque propuesto utiliza un codificador bidireccional previamente basado en transformadores con una tarea de modelado de lenguaje enmascarado, ajustado en registros normales para capturar patrones sintácticos y semánticos específicos de dominio esenciales para una detección de anomalías precisa. Las anomalías se identifican a través de probabilidades de reconstrucción a nivel de token, agregadas en puntajes a nivel de registro, con umbral basado en percentiles adaptativos calibrados solo en datos normales. Esto permite que el modelo se adapte dinámicamente a los comportamientos del sistema en evolución al tiempo que evita los umbrales rígidos basados ​​en la heurística comunes en los sistemas tradicionales. Evaluamos el adalo en los conjuntos de datos de referencia BGL, Thunderbird y Spirit, que muestra una fuerte generalización y un rendimiento competitivo en comparación con los métodos supervisados ​​de vanguardia y no supervisados. Estudios de ablación adicionales examinan los efectos del enmascaramiento, el ajuste fino y el posicionamiento de tokens en el comportamiento del modelo e interpretabilidad.

Publicado Originalme en rss.arxiv.org El 20 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web