COVID-19 detection in radiological text reports integrating entity recognition

Publicaciones

El diagnóstico de COVID-19 suele basarse en la prueba PCR que utiliza imágenes radiológicas, principalmente la Tomografía Computarizada (TC) de tórax para la evaluación de la afectación pulmonar por COVID-19. Sin embargo, los informes radiológicos textuales también contienen información relevante para determinar la probabilidad de presentar signos radiológicos de COVID-19 que afecten a los pulmones.

El desarrollo de sistemas de detección automática de COVID-19 basados en técnicas de Procesamiento del Lenguaje Natural (PLN) podría ser de gran ayuda para apoyar a los clínicos y detectar trastornos relacionados con COVID-19 dentro de los informes radiológicos. En este trabajo proponemos un sistema de clasificación de textos basado en la integración de diferentes fuentes de información.

El sistema puede utilizarse para predecir automáticamente si un paciente tiene o no hallazgos radiológicos consistentes con COVID-19 sobre la base de informes radiológicos de TAC de tórax. Para llevar a cabo nuestros experimentos utilizamos 295 informes radiológicos de estudios de TC de tórax proporcionados por la clínica ”HT médica”. Todos ellos son solicitudes radiológicas con sospecha de afectación torácica por COVID-19. Para entrenar nuestro sistema de clasificación de textos aplicamos enfoques de aprendizaje automático y reconocimiento de entidades nombradas.

El sistema toma como entrada dos fuentes de información: el texto del informe radiológico y los trastornos relacionados con COVID-19 extraídos de SNOMED-CT. El mejor sistema se entrena mediante SVM y los resultados de referencia alcanzan un 85% de precisión en la predicción de la afectación pulmonar por COVID-19, lo que ya ofrece valores competitivos difíciles de superar. Además, aplicamos información mutua para integrar la información de mejor calidad extraída de SNOMED-CT. De este modo, logramos una precisión de alrededor del 90%, mejorando los resultados de referencia en 5 puntos.

Cita bibliográfica:  Computers in Biology and Medicine Volume 127, December 2020, 104066 https://doi.org/10.1016/j.compbiomed.2020.104066

Autores: López Úbeda, Pilar | Díaz Galiano, Manuel Carlos | Martín Noguerol, Teodoro | Luna, Antonio | Ureña López, L. Alfonso | Martín Valdivia, María Teresa

Enlace a publicación: https://www.sciencedirect.com/science/article/pii/S0010482520303978