Resumen: Los juegos de rol basados en LLM han mejorado rápidamente en fidelidad, sin embargo, una mayor adherencia a las limitaciones de la persona comúnmente aumenta la vulnerabilidad a los ataques de jailbreak, especialmente para personas riesgosas o negativas.
Leer más →
Resumen: Presentamos PlotChain, un punto de referencia determinista basado en generador para evaluar modelos multimodales de lenguaje grande (MLLM) en la lectura de gráficos de ingeniería, recuperando valores cuantitativos de gráficos clásicos (por ejemplo, Bode/FFT, respuesta escalonada, tensión-deformación, curvas de bombeo) en lugar de extracción solo de OCR o subtítulos de forma libre.
Leer más →
Resumen:A pesar de los recientes avances en inteligencia artificial, muchos sistemas muestran un estancamiento en la adaptabilidad a largo plazo a pesar de la continua optimización del rendimiento.
Leer más →