Clasificación de historias clínicas reales según CIE-10-ES para localización de neoplasias mediante modelos transformers.

Research Projects

Organizational Units

Journal Issue

Abstract

La mayoría de la información clínica almacenada en los sistemas sanitarios españoles se encuentra como texto no estructurado en las historias clínicas electrónicas. La extracción automática de información valiosa contenida en estos documentos es una tarea crítica. Como información valiosa para las unidades de análisis clínicos de oncología, se encuentra la localización de la neoplasia que presenta un paciente. Esta localización, incluida en la categoría de la codificación CIE-10-ES, puede ser extraída de los textos mediante el procesamiento del lenguaje natural. Para ello, en este estudio hemos desarrollado metodologías basadas en el estado del arte del procesamiento del lenguaje natural, los modelos Transformers. Los resultados obtenidos muestran que la aplicación de estos modelos es de gran ayuda en esta tarea. En particular, el modelo RoBERTa-Base-Biomed obtuvo el mejor rendimiento, con un valor de 0.946 en porcentaje de aciertos, 0.920 en precisión, 0.898 en sensibilidad y 0.908 en F1-score, mostrando un gran rendimiento para la mayoría de las clases.

Description

Copyright de los autores

Bibliographic citation

A. Pascual-Mellado, F. Gallego, N. Ribelles, J. M. Jerez, F. J. Moreno-Barea. Clasificación de Historias Clínicas Reales según CIE-10-ES para Localización de Neoplasias mediante Modelos Transformers. XX Conferencia de la Asociación Española para la Inteligencia Artificial (CAEPIA 2024). Organizado por la Asociación Española para la Inteligencia Artificial (AEPIA). A Coruña, España. Del 19 al 21 de junio de 2024. ISBN: 978-84-09-62724-0. Páginas: 680-685.

Endorsement

Review

Supplemented By

Referenced by