Resumen: Mostramos que los PLDR-LLM preentrenados en criticidad autoorganizada exhiben razonamiento en el momento de la inferencia. Las características de las salidas deductivas PLDR-LLM en criticidad son similares a las transiciones de fase de segundo orden. En el momento crítico, la longitud de la correlación diverge y las salidas deductivas alcanzan un estado estable metaestable.
Leer más →
Resumen: El notable progreso del aprendizaje por refuerzo (RL) está intrínsecamente ligado a los entornos utilizados para entrenar y evaluar agentes artificiales. Yendo más allá de las revisiones cualitativas tradicionales, este trabajo presenta una investigación empírica a gran escala basada en datos sobre la evolución de los entornos de RL.
Leer más →
Resumen: Los avances recientes en modelos de lenguaje grande (LLM) sugieren un gran potencial para la automatización del diseño de circuitos analógicos.
Leer más →