explicacion_campos.txt 2.19 KB
Newer Older
Rafael Artinano's avatar
Rafael Artinano committed
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
*Forman parte de patron.Ej: AAABBB. Si los patrones son AA y BB el valor será 6 si el AA esta en las posiciones 1 y 2 y BB en las posiciones 4 y 5. 4 si esta AA en la posicion 2 y BB en la posicion 4. 5 otras combinaciones en este ejemplo.


CSV Metrica_coincidencia.

      %Coincidencia: Calcula el porcentaje sobre 100 de los caracteres que forman parte de un patron en comun a las 2 proteinas respecto al total de caracteres de la proteina mas corta. Ej: AAABBBB AABBBBBB, patrones AA 2 veces BBB 4 veces en 1 y 2 en otra. El % seria el 100% en este caso ya que todos los caracteres de A forman parte de patrones comunes*. 



CSV Proteinas ocurrencia

    Maximum ocurrence: numero total de caracteres de la proteina.

    Patrones: Patron y en loc_ocurrence: numero de caracteres que tienen o forman parte de ese patron* dividido entre el maximum ocurrence

    Global ocurrence: numero total de caracteres que forman parte de un patron*.

CSV Patrones ocurrencia:

    Longitud_apariciones: numero de proteinas en las que aparece ese patron.

    %Ocurrencia_caracter: suma de los caracteres que conforman ese patron* entre todas las proteinas que contienen dicho patron dividido entre la suma de los caracteres de esas proteinas en porcentaje. Ej AAAABBB AAAACCCC el patron AAAA son 8 caracteres dividido entre 11 por 100.
    longitud_Apariciones_Proteina: numero sumado de caracteres pertenecientes a patron* de todas las proteinas que tienen ese patron. Ej AAABBB AAACCC BBBCCC. Con AAA seria de 6.
    
    %Patron: numero de proteinas que tienen ese patron dividido entre el numero de proteinas que tienen un patron el que sea.
    
    %Patron_proteina: es el numero de caracteres que conformen ese patron sumados de todas las proteinas dividido entre el numero de caracteres totales que forman parte de algun patron.Metrica similar a %Patrones pero esto permite castigar mas a los patrones mas cortos.
    
    total_Patrones: numero proteinas por patron, si tiene una proteina 2 patrones distintos se cuenta 2 veces.
    
    total_Patrones_por_prot: numero de caracteres pertenecientes a un patron*. 
     
    
     

Metrica_patrones comunes:

    Patrones: Patrones en comun entre las dos proteinas y su longitud.