Transformers & Graph Algorithms against colon cancer (AI4EU – ColoNLP)
Desarrollo de una herramienta que dado un texto médico libre, utilizando técnicas de procesado natural del lenguaje (NLP) sea capaz de extraer e identificar de forma automática los códigos ICD-10 de diagnóstico y de procedimientos.
El objetivo final es ayudar, con la extracción de los códigos ICD-10 y en combinación con las características moleculares, mejorar el algoritmo que dispone Amadix para la predicción del cáncer colorectal e identificar la población con alto riesgo de padecer este tipo de cáncer.
La principal idea es, usando técnicas de procesado de lenguaje natural (NLP) centradas en el lenguaje Español, identificar sobre estos documentos que otras patologías sufren los pacientes y mapearlas dentro de los códigos ICD-10, los cuales son unos códigos estándar para enfermedades y procedimientos, e identificar diferentes comorbilidades que podrian afectar al desarrollod del cancel colorectal. Una vez que los registros clínicos han sido analizados para obtener los datos, estos datos serán combinados con los resultados de los tests de sangre desarrollados por AMADIX, para crear modelos basados en Inteligencia Artificial que permitan: