Resumen:Los registros del sistema son una piedra angular de la ciberseguridad y respaldan la prevención proactiva de infracciones y las investigaciones posteriores a incidentes. Sin embargo, analizar grandes cantidades de datos de registros diversos sigue siendo un desafío significativo, ya que los altos costos, la falta de experiencia interna y las limitaciones de tiempo dificultan incluso el análisis básico para muchas organizaciones. Este estudio presenta LLMLogAnalyzer, un chatbot de análisis de registros basado en agrupaciones que aprovecha los algoritmos de modelos de lenguaje grandes (LLM) y aprendizaje automático (ML) para simplificar y optimizar los procesos de análisis de registros. Este enfoque innovador aborda las limitaciones clave de LLM, incluidas las limitaciones de las ventanas de contexto y las capacidades deficientes de manejo de texto estructurado, lo que permite tareas de resumen, extracción de patrones y detección de anomalías más efectivas. LLMLogAnalyzer se evalúa en cuatro registros de dominio distintos y varias tareas. Los resultados demuestran mejoras significativas en el rendimiento con respecto a los chatbots de última generación basados en LLM, incluidos ChatGPT, ChatPDF y NotebookLM, con ganancias constantes que van del 39 % al 68 % en diferentes tareas. El sistema también muestra una gran solidez, logrando una reducción del 93 % en el rango intercuartil (IQR) cuando se utilizan puntuaciones ROUGE-1, lo que indica una variabilidad de resultados significativamente menor. La eficacia del marco se debe a su arquitectura modular que comprende un enrutador, un reconocedor de registros, un analizador de registros y herramientas de búsqueda. Este diseño mejora las capacidades de LLM para el análisis de texto estructurado al tiempo que mejora la precisión y la solidez, lo que lo convierte en un recurso valioso tanto para los expertos en ciberseguridad como para los usuarios no técnicos.
Publicado originalmente en export.arxiv.org el 28 de octubre de 2025.
Ver fuente original
