Resumen: Los registros constituyen una forma de evidencia que indica el estado operativo de los sistemas de software. La detección automatizada de anomalías de registro es crucial para garantizar la confiabilidad de los sistemas de software modernos. Sin embargo, los enfoques existentes enfrentan limitaciones significativas: los modelos tradicionales de aprendizaje profundo carecen de interpretabilidad y generalización, mientras que los métodos que aprovechan los modelos de idiomas grandes a menudo se ven obstaculizados por inexactitudes de falta de confiabilidad e objetivos. Para abordar estos problemas, proponemos racionales, un marco novedoso que mejora la detección de anomalías logarítmicas mediante la sinergia de la cadena de pensamiento (cot) ajustado con aprendizaje de refuerzo. Nuestro enfoque primero inculca patrones de razonamiento de expertos utilizando ajustes finos supervisados guiados por cuna, basado en un conjunto de datos de alta calidad corregido a través de un riguroso proceso impulsado por expertos. Posteriormente, una fase de aprendizaje de refuerzo con una función de recompensa multifacética optimiza la precisión y la consistencia lógica, mitigando efectivamente las alucinaciones. Experimentalmente, la racionanomalía supera a las líneas de base de última generación, logrando puntajes F1 superiores en puntos de referencia clave al tiempo que proporciona salidas analíticas transparentes y paso a paso. Hemos publicado los recursos correspondientes, incluidos los códigos y los conjuntos de datos.
Publicado Originalme en export.arxiv.org El 18 de septiembre de 2025.
Ver Fuente Original