SINAI at CLEF eHealth 2020: testing different pre-trained word embeddings for clinical coding in Spanish

Publicaciones

Este artículo describe el sistema presentado por el equipo SINAI para la tarea de extracción de información multilingüe del CLEF eHealth Lab 2020. Esta tarea se centra en la asignación automática de de los códigos de la Clasificación Internacional de Enfermedades (CIE) a textos relacionados con la salud en español. Nuestra propuesta sigue un enfoque basado en el aprendizaje profundo donde hemos utilizado la variante bidireccional de una red de memoria a largo plazo (LSTM) junto con una capa de decodificación de campos aleatorios condicionales apilados (CRF) apilados (BiLSTM+CRF). El objetivo de los experimentos realizados era probar el rendimiento de diferentes incrustaciones de palabras preentrenadas para reconocer diagnósticos y procedimientos en textos clínicos. El principal La principal conclusión fue que la combinación de incrustaciones de palabras podría ser una estrategia útil para aplicar a los enfoques basados en el aprendizaje profundo, aunque las incrustaciones combinadas combinadas no pertenezcan al ámbito médico. Las mejores puntuaciones MAP logradas fueron de 0,314 y 0,293 para las subtareas CodiEsp-D y CodiEsp-P, respectivamente.

Cita bibliográfica: Working Notes of Conference and Labs of the Evaluation (CLEF) Forum.

Autores: Perea Ortega, José M | López Úbeda, Pilar | Díaz Galiano, Manuel Carlos | Martín Valdivia, María Teresa | Ureña López, L. Alfonso

Enlace a publicación: http://ceur-ws.org/Vol-2696/paper_117.pdf