Resumen: El LLM como juez se ha convertido en el paradigma dominante para evaluar los resultados de los modelos lingüísticos; sin embargo, los jueces del LLM exhiben sesgos sistemáticos que comprometen la confiabilidad de la evaluación.
Leer más →
Resumen: La amenaza emergente de los ataques de ingeniería social basados en AR-LLM (AR-LLM-SE) (por ejemplo, SEAR) plantea un riesgo significativo para las interacciones sociales del mundo real. En un ataque de este tipo, un actor malintencionado utiliza gafas de realidad aumentada (AR) para capturar datos visuales y vocales del objetivo.
Leer más →
Resumen:Generar automáticamente ontologías formales a partir de lenguaje natural no estructurado sigue siendo un desafío central en la ingeniería del conocimiento. Si bien los modelos de lenguajes grandes (LLM) son prometedores, aún no está claro qué opciones de diseño arquitectónico impulsan la calidad de la generación y por qué fallan los enfoques actuales.
Leer más →