Mente Prometheus: adaptación de la memoria a modelos de lenguaje congelados

Resumen:Agregar memoria a modelos de lenguaje previamente entrenados generalmente requiere cambios arquitectónicos o modificaciones de peso. Presentamos Prometheus Mind, que adapta la memoria a un Qwen3-4B congelado usando 11 adaptadores modulares (530 MB, 7 % de sobrecarga), totalmente reversible quitando los adaptadores.

Leer más →

Comentarios desactivados en Mente Prometheus: adaptación de la memoria a modelos de lenguaje congelados

Agentes financieros reproducibles: un arnés de garantía de determinismo y fidelidad para agentes de LLM que utilizan herramientas

Resumen:En 74 configuraciones (12 modelos, 4 proveedores, 8-24 ejecuciones cada una a T=0,0) en experimentos de referencia no agentes, los modelos de parámetros 7-20B lograron un 100% de determinismo, mientras que los modelos 120B+ requirieron muestras de validación 3,7 veces más grandes para lograr una confiabilidad estadística equivalente.

Leer más →

Comentarios desactivados en Agentes financieros reproducibles: un arnés de garantía de determinismo y fidelidad para agentes de LLM que utilizan herramientas

El cambio de paradigma: una encuesta exhaustiva sobre modelos de lenguaje de visión amplia para la detección multimodal de noticias falsas

Resumen:En los últimos años, la rápida evolución de los grandes modelos de visión y lenguaje (LVLM) ha impulsado un cambio de paradigma en la detección multimodal de noticias falsas (MFND), transformándola de enfoques tradicionales de ingeniería de características a marcos de razonamiento multimodal unificados de extremo a extremo.

Leer más →

Comentarios desactivados en El cambio de paradigma: una encuesta exhaustiva sobre modelos de lenguaje de visión amplia para la detección multimodal de noticias falsas

Fin del contenido

No hay más páginas por cargar