En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Evaluación de la calidad de la aleatoriedad y la entropía en tareas respaldadas por modelos de lenguaje grandes

Evaluación de la calidad de la aleatoriedad y la entropía en tareas respaldadas por modelos de lenguaje grandes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:El rápido avance de la tecnología de modelos de lenguaje grande (LLM) ha dado lugar a diversas aplicaciones, muchas de las cuales requieren inherentemente aleatoriedad, como la toma de decisiones estocástica, los juegos, la programación, los agentes de inteligencia artificial y las tareas relacionadas con la criptografía. Sin embargo, las capacidades de los LLM para manejar la aleatoriedad, particularmente para generar y utilizar números aleatorios de manera efectiva, siguen sin estar claras. Este artículo investiga la capacidad de los LLM para manejar tareas que involucran aleatoriedad a través de una serie de experimentos. Diseñamos un conjunto de experimentos que consideran varios factores que pueden influir en el desempeño de un LLM en tareas que involucran aleatoriedad, como la accesibilidad a herramientas externas, tipos de tareas, estados del modelo (nuevo versus no nuevo) y estrategias de estimulación. Los experimentos cubren una variedad de tareas, incluida la generación de números aleatorios, la generación de cadenas aleatorias como contraseñas, la combinación aleatoria de elementos y la evaluación de la calidad de la aleatoriedad utilizando entropía y el conjunto de pruebas de aleatoriedad del NIST. Nuestros hallazgos revelan que, si bien los LLM pueden generar resultados que exhiben cierto grado de aleatoriedad, su desempeño es inconsistente y a menudo se desvía significativamente del comportamiento esperado. El análisis de los resultados experimentales resalta las limitaciones clave y las áreas donde se necesitan mejoras para que los LLM manejen de manera efectiva tareas que involucran aleatoriedad.

Publicado originalmente en export.arxiv.org el 14 de octubre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web