Resumen:Agregar memoria a modelos de lenguaje previamente entrenados generalmente requiere cambios arquitectónicos o modificaciones de peso. Presentamos Prometheus Mind, que adapta la memoria a un Qwen3-4B congelado usando 11 adaptadores modulares (530 MB, 7 % de sobrecarga), totalmente reversible quitando los adaptadores.
Leer más →
Resumen:En 74 configuraciones (12 modelos, 4 proveedores, 8-24 ejecuciones cada una a T=0,0) en experimentos de referencia no agentes, los modelos de parámetros 7-20B lograron un 100% de determinismo, mientras que los modelos 120B+ requirieron muestras de validación 3,7 veces más grandes para lograr una confiabilidad estadística equivalente.
Leer más →
Resumen:En los últimos años, la rápida evolución de los grandes modelos de visión y lenguaje (LVLM) ha impulsado un cambio de paradigma en la detección multimodal de noticias falsas (MFND), transformándola de enfoques tradicionales de ingeniería de características a marcos de razonamiento multimodal unificados de extremo a extremo.
Leer más →