Commit c377a26e authored by Maria Marin's avatar Maria Marin

Update README.md

parent c4e09b14
...@@ -24,12 +24,13 @@ Este directorio contiene los datos referentes a los nodos y enlaces empleados pa ...@@ -24,12 +24,13 @@ Este directorio contiene los datos referentes a los nodos y enlaces empleados pa
| Enfermedad – Síntoma (dse_sym.tsv) | Asociaciones entre enfermedades y los síntomas que desarrollan | CUI de UMLS – Concept Unique Identifiers de UMLS | 318.550 | ChEMBL y (Side Effect Resource) SIDER | | Enfermedad – Síntoma (dse_sym.tsv) | Asociaciones entre enfermedades y los síntomas que desarrollan | CUI de UMLS – Concept Unique Identifiers de UMLS | 318.550 | ChEMBL y (Side Effect Resource) SIDER |
## Filtrado de síntomas ## Filtrado de síntomas
Se incluye el archivo con la relación entre TUIs, CUIs y STYs (**cuis_stys.tsv**) y el Jupyter Notebook (**Archivo síntomas.ipynb**) empleados para realizar el filtrado del archivo **dse_sym.tsv**, que da como reultado el archivo **dse_sym_limpio.tsv**.
#### Motivo del filtrado
La información referente a los síntomas se almacena en un archivo que contiene asociaciones entre enfermedades y síntomas, ambos grupos identificados a través de Concept Unique Identifiers (CUIs) de Unique Medical Language System (UMLS). La información referente a los síntomas se almacena en un archivo que contiene asociaciones entre enfermedades y síntomas, ambos grupos identificados a través de Concept Unique Identifiers (CUIs) de Unique Medical Language System (UMLS).
Una de las características de este sistema es el empleo de un mismo CUI para identificar un conjunto de nomenclaturas consideradas como sinónimas o variantes léxicas. Por tanto, si un término o conjunto de términos es polisémico, su CUI también lo será. Una de las características de este sistema es el empleo de un mismo CUI para identificar un conjunto de nomenclaturas consideradas como sinónimas o variantes léxicas. Por tanto, si un término o conjunto de términos es polisémico, su CUI también lo será.
<br><br> <br><br>
Sin embargo, esta propiedad supone una normalización excesiva en ciertas ocasiones, de forma que un CUI puede llegar a incluir sinónimos no verdaderos. Sin embargo, esta propiedad supone una normalización excesiva en ciertas ocasiones, de forma que un CUI puede llegar a incluir sinónimos no verdaderos.
Esta ambigüedad en el sistema de identificación provoca que ciertos CUIs se encuentren tanto en la columna de enfermedades como en la columna de síntomas en el fichero de datos. Por lo tanto, aparecen relaciones interpretadas como enfermedad – enfermedad o síntoma – síntoma durante la generación de la red bipartita de enfermedades y síntomas. Esta ambigüedad en el sistema de identificación provoca que ciertos CUIs se encuentren tanto en la columna de enfermedades como en la columna de síntomas en el fichero de datos. Por lo tanto, aparecen relaciones interpretadas como enfermedad – enfermedad o síntoma – síntoma durante la generación de la red bipartita de enfermedades y síntomas.
<br><br>
Para corregir este inconveniente, se realiza un filtrado de los elementos de ambas columnas a partir de los Type Unique Identifiers (TUIs). Los TUIs son los identificadores empleados en UMLS para clasificar los términos en función de una amplia serie de categorías biomédicas denominadas Semantic Types (STYs), permitiendo una categorización más específica. Para corregir este inconveniente, se realiza un filtrado de los elementos de ambas columnas a partir de los Type Unique Identifiers (TUIs). Los TUIs son los identificadores empleados en UMLS para clasificar los términos en función de una amplia serie de categorías biomédicas denominadas Semantic Types (STYs), permitiendo una categorización más específica.
<br><br> <br><br>
Se incluye el archivo con la relación entre TUIs, CUIs y STYs (**cuis_stys.tsv**) y el Jupyter Notebook (**Archivo síntomas.ipynb**) empleados para realizar el filtrado del archivo **dse_sym.tsv**, que da como reultado el archivo **dse_sym_limpio.tsv**.
\ No newline at end of file
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment