En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->REDACTOR: un marco con alimentación de LLM para la desidentificación de datos clínicos automáticos

REDACTOR: un marco con alimentación de LLM para la desidentificación de datos clínicos automáticos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Asegurar la privacidad de los datos clínicos al tiempo que preserva la utilidad es fundamental para la atención médica y el análisis de datos impulsados ​​por la IA. Los métodos de desidentificación existentes (DE-ID), incluidas las técnicas basadas en reglas, los modelos de aprendizaje profundo y los modelos de idiomas grandes (LLM), a menudo sufren errores de recuperación, generalización limitada e ineficiencias, limitando su aplicabilidad del mundo real. Proponemos un marco multimodal totalmente automatizado para la desidentificación de registros de salud electrónicos estructurados y no estructurados, incluidos los registros de audio clínicos. Nuestro marco emplea estrategias de DE-ID rentables, que incluyen enrutamiento inteligente, reglas híbridas y enfoques basados ​​en LLM, y un enfoque de redacción de audio de dos pasos. Presentamos un enfoque de relexicalización de la entidad basado en la recuperación para garantizar sustituciones consistentes de entidades protegidas, mejorando así la coherencia de datos para las aplicaciones aguas abajo. Discutimos el diseño clave desiderata, la metodología de desidentificación y relexicalización, y la arquitectura modular de REDACTX y su integración con el sistema de IA Clínica Oracle Health. Evaluado en el conjunto de datos de I2B2 2014 DE-ID utilizando métricas estándar con un retiro estricto, nuestro enfoque logra un rendimiento competitivo al tiempo que optimiza el uso del token para reducir los costos de LLM. Finalmente, discutimos las lecciones y las ideas clave a partir de la implementación en las tuberías de datos de salud con el mundo real.

Publicado Originalme en rss.arxiv.org El 26 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web