Manténgase en el personaje, manténgase a salvo: autoevolución adversaria de ciclo dual para agentes que desempeñan roles de seguridad

Resumen: Los juegos de rol basados ​​en LLM han mejorado rápidamente en fidelidad, sin embargo, una mayor adherencia a las limitaciones de la persona comúnmente aumenta la vulnerabilidad a los ataques de jailbreak, especialmente para personas riesgosas o negativas.

Leer más →

Comentarios desactivados en Manténgase en el personaje, manténgase a salvo: autoevolución adversaria de ciclo dual para agentes que desempeñan roles de seguridad

PlotChain: Evaluación determinista con puntos de control de LLM multimodales sobre lectura de tramas de ingeniería

Resumen: Presentamos PlotChain, un punto de referencia determinista basado en generador para evaluar modelos multimodales de lenguaje grande (MLLM) en la lectura de gráficos de ingeniería, recuperando valores cuantitativos de gráficos clásicos (por ejemplo, Bode/FFT, respuesta escalonada, tensión-deformación, curvas de bombeo) en lugar de extracción solo de OCR o subtítulos de forma libre.

Leer más →

Comentarios desactivados en PlotChain: Evaluación determinista con puntos de control de LLM multimodales sobre lectura de tramas de ingeniería

Fin del contenido

No hay más páginas por cargar