Anonymization of Clinical Reports in Spanish: a Hybrid Method Based on Machine Learning and Rules

Publicaciones

La biomedicina es un entorno ideal para el uso del Procesamiento del Lenguaje Natural, debido a la enorme cantidad de información procesada y almacenada en formato electrónico. Esta información no puede ser compartida con los datos confidenciales de los pacientes. En este trabajo, presentamos un sistema automatizado de anonimización de informes clínicos escritos en español. Se evalúan y comparan tres métodos diferentes. El primer método está basado en reglas, el segundo método utiliza el aprendizaje automático y el tercero es un método híbrido entre los dos primeros. La evaluación mostró que el uso del método híbrido obtuvo los mejores resultados.

Cita Bibliográfica: IberLEF. SEPLN 2019

Autores:  López Úbeda, Pilar  | Díaz Galiano, Manuel Carlos | Ureña López, L. Alfonso | Martín Valdivia, María Teresa

URL: http://ceur-ws.org/Vol-2421/MEDDOCAN_paper_7.pdf

Tareas relacionadas:

  • (En construcción)