¿Pueden los agentes del modelo de lenguaje ser útiles explicadores de circuitos en la interpretabilidad mecanicista?

Resumen: La interpretabilidad mecanicista ha logrado avances sustanciales en la localización automática de circuitos, pero explicar qué hacen los componentes localizados sigue siendo laborioso y difícil de estandarizar. En este trabajo, estudiamos si los agentes del modelo de lenguaje (LM) pueden ayudar con este problema de explicación una vez que ya se ha identificado un circuito.

Leer más →

Comentarios desactivados en ¿Pueden los agentes del modelo de lenguaje ser útiles explicadores de circuitos en la interpretabilidad mecanicista?

Selección de funciones conjuntas y optimización de Harris Hawks para una predicción explicable del riesgo de salud mental en trabajadoras sexuales

Resumen: Uno de los problemas de salud mental importantes que afectan a las trabajadoras sexuales (TSF) son los trastornos mentales, especialmente la depresión. La exposición a la violencia, el estigma y las dificultades económicas aumenta aún más su riesgo psicológico.

Leer más →

Comentarios desactivados en Selección de funciones conjuntas y optimización de Harris Hawks para una predicción explicable del riesgo de salud mental en trabajadoras sexuales

Fin del contenido

No hay más páginas por cargar