readme 877 Bytes
Newer Older
Javier Rodriguez Vidal's avatar
Javier Rodriguez Vidal committed
1 2 3 4 5 6
Carpeta que contiene el código para la extracción de conceptos UMLS + CUI

    - Config.ini --> archivo de configuración para la conexión a BBDD
    - extractor.py --> main. Recibe dos parámetros de entrada: fichero de anotaciones y output para guardar los datos
    - ConceptExtractor.py --> script que permite extraer los conceptos encontrados por BERT así como: la entidad asociada, su posición de inicio y fin en el texto
    - jkesExtractor.py --> script que busca si conceptos encontrados se encuentran en JKES o no. En el caso de encontrarlos, devuelve el CUI que tienen.
Javier Rodriguez Vidal's avatar
Javier Rodriguez Vidal committed
7 8
    - umlsExtractor.py --> script que recibe los conceptos no encontrados en JKES y recupera en el metatesauro de UMLS el concepto más similar (usando distancia Levenshtein) y el CUI asociado.
    - insertUMLSConcepts.py --> script que recibe los conceptos encontrados y los guarda en BBDD.