Resumen:La detección de texto generado por modelos de lenguaje grandes (LLM) es crucial pero desafiante. Los detectores existentes dependen de suposiciones poco prácticas, como configuraciones de caja blanca, o dependen únicamente de funciones a nivel de texto, lo que lleva a una capacidad de detección imprecisa. En este artículo, proponemos un método de detección de texto generado por LLM simple pero efectivo y práctico, VaryBalance. El núcleo de VaryBalance es que, en comparación con los textos generados por LLM, existe una mayor diferencia entre los textos humanos y su versión reescrita a través de LLM. Aprovechando esta observación, VaryBalance la cuantifica mediante la desviación estándar media y distingue los textos humanos de los textos generados por LLM. Experimentos exhaustivos demostraron que VaryBalance supera a los detectores de última generación, es decir, los binoculares, hasta en un 34,3% en términos de AUROC, y mantiene su solidez frente a múltiples modelos y lenguajes de generación.
Publicado originalmente en export.arxiv.org el 16 de febrero de 2026.
Ver fuente original
