fbpx
Wikipedia

BLOSUM

BLOSUM (BLOcks of Amino Acid SUbstitution Matrix, o matriz de sustitución de bloques de aminoácidos) es una matriz de sustitución utilizada para el alineamiento de secuencias de proteínas. BLOSUM se usa para puntuar alineamientos entre secuencias de proteínas evolutivamente divergentes. Se basa en alineamientos locales, y se introdujo en 1992 por primera vez en un artículo de Henikoff y Henikoff.[1]​ Recorrieron la base de datos BLOCKS analizando regiones muy conservadas de familias de proteínas (sin huecos en el alineamiento de secuencias) y comprobaron las frecuencias relativas de aparición de los aminoácidos y las probabilidades de sustitución entre ellos. Seguidamente calcularon una puntuación de log-probabilidad para cada una de las 210 posibles sustituciones de los 20 aminoácidos estándar. Todas las BLOSUM se basan en alineamientos observados, y no son extrapoladas de comparaciones de proteínas cercanamente relacionadas (como es el caso de las matrices PAM, obtenidas al multiplicar por sí misma un determinado número de veces una matriz inicial).

La matriz BLOSUM 62.

Existen bastantes conjuntos de matrices BLOSUM que utilizan diferentes bases de datos de alineamientos, y que se nombran con números. Las BLOSUM seguidas de un número alto están diseñadas para comparar secuencias cercanamente relacionadas, mientras que las BLOSUM con número bajo están diseñadas para comparar secuencias relacionadas de forma distante. Por ejemplo, BLOSUM 80 se usa para alineamientos menos divergentes, mientras que BLOSUM 45 se usa para alineamientos más divergentes. Las puntuaciones dentro de una matriz BLOSUM corresponden a log-probabilidades que reflejan, en un alineamiento, el logaritmo de la razón de la probabilidad de la aparición de dos aminoácidos de una forma biológicamente intencionada o aceptada (residuos homológos; este numerador es la probabilidad de la hipótesis que queremos contrastar) y la probabilidad de su aparición por casualidad (el denominador es la probabilidad de la hipótesis nula).[2]​ Las matrices se basan en el máximo porcentaje de identidad de las secuencias de proteínas alineadas usadas al calcularlas (por ejemplo, BLOSUM 45 correspondería a alineamientos con un máximo de un 45% de identidad).[3]​ A cada posible identidad o sustitución se le asigna una puntuación basada en las frecuencias observadas en el alineamiento de proteínas relacionadas.[4]​ Se da una puntuación positiva a las sustituciones más probables, mientras que corresponde una puntuación negativa para sustituciones menos probables.

BLOSUM 62 es la matriz calculada usando las sustituciones observadas entre proteínas que tienen, como máximo, el 62% de identidad en la secuencia, y se ha convertido en el estándar de la mayoría de los programas que utilizan este tipo de matrices.[2]

BLOSUM ha demostrado actuar mejor en la puntuación de secuencias distantemente relacionadas que las otrora ampliamente usadas matrices Point Accepted Mutation (PAM).[5]

Para calcular una matriz BLOSUM se usa la siguiente ecuación:

Aquí, es la probabilidad de que dos aminoácidos y reemplacen uno al otro en una secuencia homóloga, mientras que y son las probabilidades últimas de encontrar los aminoácidos y en cualquier secuencia de proteína de forma aleatoria. El factor es un mero factor de escala para asegurar que, tras su aplicación y la de un necesario redondeo al entero más cercano, la matriz contenga valores enteros dispersos y fácilmente tratables. De acuerdo a la definición vista, el logaritmo de la ecuación (el resultado de la ecuación, en definitiva) será positivo siempre que el cociente sea mayor de uno. Esto significará que la probabilidad de alineamiento entre los dos aminoácidos en una determinada secuencia se dará con mayor frecuencia que la que podríamos esperar por la mera casualidad. En resumen: esta sustitución es aceptada (en mayor o menor grado, de acuerdo a sus resultados estadísticos) por la evolución. Por el contrario, un logaritmo nulo o negativo implica que las sustituciones se dan al mismo (o menor) ritmo que las esperadas aleatoriamente.

Referencias

  1. Henikoff, S. (1992). «Amino Acid Substitution Matrices from Protein Blocks». PNAS 89: 10915-10919. PMID 1438297. doi:10.1073/pnas.89.22.10915. 
  2. *Sean R. Eddy. . Nature Biotechnology. PMID 15286655. doi:10.1038/nbt0804-1035. Archivado desde el original el 3 de septiembre de 2006. 
  3. Albert Y. Zomaya (2006). Handbook of Nature-Inspired And Innovative Computing. ISBN 0387405321. page 673
  4. Korf, I et al. (2003). «4 - Sequence Similarity». En O'Reilly, ed. BLAST. p. 55. ISBN 0-596-00299-8. 

Enlaces externos

  • Archivos de datos de matrices BLOSUM en el servidor FTP del NCBI

Véase también

  •   Datos: Q796244

blosum, blocks, amino, acid, substitution, matrix, matriz, sustitución, bloques, aminoácidos, matriz, sustitución, utilizada, para, alineamiento, secuencias, proteínas, para, puntuar, alineamientos, entre, secuencias, proteínas, evolutivamente, divergentes, ba. BLOSUM BLOcks of Amino Acid SUbstitution Matrix o matriz de sustitucion de bloques de aminoacidos es una matriz de sustitucion utilizada para el alineamiento de secuencias de proteinas BLOSUM se usa para puntuar alineamientos entre secuencias de proteinas evolutivamente divergentes Se basa en alineamientos locales y se introdujo en 1992 por primera vez en un articulo de Henikoff y Henikoff 1 Recorrieron la base de datos BLOCKS analizando regiones muy conservadas de familias de proteinas sin huecos en el alineamiento de secuencias y comprobaron las frecuencias relativas de aparicion de los aminoacidos y las probabilidades de sustitucion entre ellos Seguidamente calcularon una puntuacion de log probabilidad para cada una de las 210 posibles sustituciones de los 20 aminoacidos estandar Todas las BLOSUM se basan en alineamientos observados y no son extrapoladas de comparaciones de proteinas cercanamente relacionadas como es el caso de las matrices PAM obtenidas al multiplicar por si misma un determinado numero de veces una matriz inicial La matriz BLOSUM 62 Existen bastantes conjuntos de matrices BLOSUM que utilizan diferentes bases de datos de alineamientos y que se nombran con numeros Las BLOSUM seguidas de un numero alto estan disenadas para comparar secuencias cercanamente relacionadas mientras que las BLOSUM con numero bajo estan disenadas para comparar secuencias relacionadas de forma distante Por ejemplo BLOSUM 80 se usa para alineamientos menos divergentes mientras que BLOSUM 45 se usa para alineamientos mas divergentes Las puntuaciones dentro de una matriz BLOSUM corresponden a log probabilidades que reflejan en un alineamiento el logaritmo de la razon de la probabilidad de la aparicion de dos aminoacidos de una forma biologicamente intencionada o aceptada residuos homologos este numerador es la probabilidad de la hipotesis que queremos contrastar y la probabilidad de su aparicion por casualidad el denominador es la probabilidad de la hipotesis nula 2 Las matrices se basan en el maximo porcentaje de identidad de las secuencias de proteinas alineadas usadas al calcularlas por ejemplo BLOSUM 45 corresponderia a alineamientos con un maximo de un 45 de identidad 3 A cada posible identidad o sustitucion se le asigna una puntuacion basada en las frecuencias observadas en el alineamiento de proteinas relacionadas 4 Se da una puntuacion positiva a las sustituciones mas probables mientras que corresponde una puntuacion negativa para sustituciones menos probables BLOSUM 62 es la matriz calculada usando las sustituciones observadas entre proteinas que tienen como maximo el 62 de identidad en la secuencia y se ha convertido en el estandar de la mayoria de los programas que utilizan este tipo de matrices 2 BLOSUM ha demostrado actuar mejor en la puntuacion de secuencias distantemente relacionadas que las otrora ampliamente usadas matrices Point Accepted Mutation PAM 5 Para calcular una matriz BLOSUM se usa la siguiente ecuacion a i j 1 l log p i j q i q j displaystyle a ij left frac 1 lambda right log left frac p ij q i q j right Aqui p i j displaystyle p ij es la probabilidad de que dos aminoacidos i displaystyle i y j displaystyle j reemplacen uno al otro en una secuencia homologa mientras que q i displaystyle q i y q j displaystyle q j son las probabilidades ultimas de encontrar los aminoacidos i displaystyle i y j displaystyle j en cualquier secuencia de proteina de forma aleatoria El factor l displaystyle lambda es un mero factor de escala para asegurar que tras su aplicacion y la de un necesario redondeo al entero mas cercano la matriz contenga valores enteros dispersos y facilmente tratables De acuerdo a la definicion vista el logaritmo de la ecuacion el resultado de la ecuacion en definitiva sera positivo siempre que el cociente sea mayor de uno Esto significara que la probabilidad de alineamiento entre los dos aminoacidos en una determinada secuencia se dara con mayor frecuencia que la que podriamos esperar por la mera casualidad En resumen esta sustitucion es aceptada en mayor o menor grado de acuerdo a sus resultados estadisticos por la evolucion Por el contrario un logaritmo nulo o negativo implica que las sustituciones se dan al mismo o menor ritmo que las esperadas aleatoriamente Referencias Editar Henikoff S 1992 Amino Acid Substitution Matrices from Protein Blocks PNAS 89 10915 10919 PMID 1438297 doi 10 1073 pnas 89 22 10915 a b Sean R Eddy Where did the BLOSUM62 alignment score matrix come from Nature Biotechnology PMID 15286655 doi 10 1038 nbt0804 1035 Archivado desde el original el 3 de septiembre de 2006 Albert Y Zomaya 2006 Handbook of Nature Inspired And Innovative Computing ISBN 0387405321 page 673 NIH Scoring Systems Korf I et al 2003 4 Sequence Similarity En O Reilly ed BLAST p 55 ISBN 0 596 00299 8 Enlaces externos EditarPagina sobre matrices BLOSUM Servidor WWW BLOCKS Sistemas de puntuacion para BLAST en el NCBI Archivos de datos de matrices BLOSUM en el servidor FTP del NCBIVease tambien EditarAlineamiento de secuencias Alineamiento multiple de secuencias Matriz de sustitucion Point accepted mutation PAM Datos Q796244 Obtenido de https es wikipedia org w index php title BLOSUM amp oldid 117945437, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos