fbpx
Wikipedia

Predicción de la estructura de las proteínas

La predicción de la estructura de las proteínas es la predicción o cálculo de la estructura tridimensional de una proteína desde su secuencia de aminoácidos, es decir, la predicción de sus estructuras secundaria y terciaria desde su estructura primaria. La predicción de la estructura es fundamentalmente diferente del problema inverso del diseño de proteínas. Es uno de los principales objetivos de la bioinformática y de la química teórica, y altamente importante en medicina (en diseño de fármacos, por ejemplo) y biotecnología (en el diseño de nuevas enzimas, por ejemplo).

Existen dos estrategias básicas para aproximarse a la predicción de la estructura: la predicción de novo, en la que se suelen utilizar métodos estocásticos; y la predicción por comparación, en la que se recurre a una biblioteca de estructuras previamente conocidas.

Cada dos años se evalúa el rendimiento de los métodos actuales en el experimento CASP (Critical Assessment of Techniques for Protein Structure Prediction, Evaluación Crítica de Técnicas para la Predicción de la Estructura de las Proteínas).En julio de 2021 DeepMind y EMBL (Laboratorio Europeo de Biología Molecular), publican la predicción más de 350 000 estructuras tridimensionales de proteínas.[1][2]

Estructura secundaria

La predicción de la estructura secundaria es un conjunto de técnicas bioinformáticas cuyo objetivo es predecir la estructura secundaria local de secuencias de proteínas y ARN basándose sólo en el conocimiento de su estructura primaria de aminoácidos o de nucleótidos, respectivamente. Para las proteínas, una predicción consiste en asignar regiones como probables hélices alfa, hebras beta (denominadas a menudo «conformaciones extendidas»), o bucles beta. El éxito de una predicción se determina por su comparación con los resultados de aplicar el algoritmo DSSP (método estándar para asignar una estructura secundaria a los aminoácidos de una proteína dadas sus coordenadas atómicas de resolución) a la estructura cristalina de la proteína. Para ácidos nucleicos, podría determinarse por el patrón de puentes de hidrógeno. Se han desarrollado algoritmos para la detección de patrones específicos bien definidos tales como hélices transmembrana y hélices superenrolladas en las proteínas, o estructuras de microARN en el ARN.[3]

Los mejores métodos modernos de predicción de estructura secundaria en proteínas alcanzan alrededor del 80% de precisión. Tan alto porcentaje permite el uso de las predicciones en el enhebrado de proteínas y la predicción de la estructura proteica ab initio, la clasificación de motivos estructurales, y el refinamiento de los alineamientos de secuencias. La precisión de los métodos actuales de predicción de la estructura secundaria se evalúa en comparaciones semanales tales como LiveBench y EVA.

Antecedentes

Los métodos iniciales de predicción de la estructura secundaria, introducidos en la década de los 60 y los primeros 70 del siglo XX,[4]​ se centraron en la identificación de posibles hélices alfa y se basaron, principalmente, en modelos de transición hélice-ovillo.[5]​ En los 70 se introdujeron predicciones significativamente más precisas, que incluían hojas beta. Su fundamento se encontraba en evaluaciones estadísticas basadas en parámetros de probabilidad derivados de estructuras resueltas conocidas. Estos métodos, aplicados a una única secuencia, tienen como mucho una precisión del 60-65%, aunque a menudo no predicen correctamente las hojas beta.[3]​ La conservación evolutiva de estructuras secundarias puede ser aprovechada mediante la evaluación simultánea de varias secuencias homólogas en un alineamiento múltiple de secuencias, calculando así la propensión de una secuencia de aminoácidos alineada a formar redes de estructura secundaria.

Conjuntando estos métodos con grandes bases de datos de estructuras proteicas conocidas y con los métodos actuales de aprendizaje automático tales como redes neuronales artificiales y máquinas de soporte vectorial, puede alcanzarse hasta un 80% de precisión en proteínas globulares.[6]​ El límite teórico superior de precisión se encuentra alrededor del 90%[6]​ debido, en parte, a la idiosincrasia en la asignación del DSSP cerca de los extremos de las estructuras secundarias, donde las conformaciones locales varían bajo condiciones nativas pero pueden forzarse para asumir una única conformación cristalina debido a las restricciones del empaquetado. También impone restricciones la incapacidad de la predicción de la estructura secundaria de tomar en cuenta la estructura terciaria. Por ejemplo, una secuencia predicha como probable hélice puede ser capaz todavía de adoptar una conformación de hebra beta si está localizada dentro de una región hoja beta de la proteína y sus cadenas laterales encajan bien con sus vecinas. Los cambios conformacionales drásticos relacionados con la función o el entorno de la proteína pueden alterar también la estructura secundaria local.

Método de Chou-Fasman

El método de Chou-Fasman fue uno de los primeros algoritmos desarrollados para la predicción de la estructura secundaria, y se fundamenta predominantemente sobre parámetros de probabilidad determinados por las frecuencias relativas de las apariciones de cada aminoácido en cada tipo de estructura secundaria.[7]​ Los parámetros originales del Chou-Fasman, determinados desde el pequeño conjunto de estructuras resueltas a mediados de los 70, producen resultados pobres en comparación con los obtenidos por los métodos modernos, aunque la parametrización haya sido actualizada desde su primera publicación. El método Chou-Fasman es preciso, aproximadamente, en un 50-60% en la predicción de estructuras secundarias.[3]

Método GOR

El método GOR, así denominado por los tres científicos que lo desarrollaron (Garnier, Osguthorpe y Robson), es un método basado en la teoría de la información desarrollado no mucho después del Chou-Fasman, y usa técnicas probabilísticas más apropiadas de inferencia bayesiana.[8]​ Este método toma en consideración no sólo la probabilidad de que cada aminoácido tenga una particular estructura secundaria, sino también la probabilidad condicional de que el aminoácido asuma cada estructura considerando que sus vecinos asuman la misma estructura. Este método es más sensible y preciso puesto que las tendencias estructurales de los aminoácidos son considerables sólo para un pequeño número de estas moléculas, tales como la prolina y la glicina. El método GOR original es preciso en aproximadamente el 65%, y muchísimo más exitoso en la predicción de hélices alfa que hojas beta, que frecuentemente son calculadas erróneamente como bucles o como regiones desorganizadas.[3]

Aprendizaje automático

Los métodos basados en redes neuronales artificiales utilizan conjuntos de entrenamiento cuyos elementos son estructuras resueltas para identificar secuencias motivo comunes asociadas con disposiciones particulares de estructuras secundarias. Estos métodos están sobre el 70% de precisión en sus predicciones, aunque las hebras beta todavía vienen siendo predichas en poca medida debido a la carencia de información estructural tridimensional que pudiera permitir la evaluación de los patrones de puentes de hidrógeno con los que pudiera promoverse la formación de la conformación extendida requerida para la presencia de una hoja beta completa.[3]

Las máquinas de soporte vectorial (MSV) han demostrado ser particularmente útiles en la predicción de las localizaciones de los bucles, que son difíciles de identificar con métodos estadísticos.[9]​ Se ha citado también la necesidad de relativamente pequeños conjuntos de entrenamiento como una ventaja para evitar un excesivo ajuste sobre los datos estructurales existentes.[10]

Algunas extensiones a las técnicas de aprendizaje automático intentan predecir propiedades locales de granularidad más fina en las proteínas, como los ángulos diedros en determinadas regiones del esqueleto de las proteínas. Se han aplicado a este problema tanto MSVs[11]​ como redes neuronales.[12]

Otras mejoras

Además de la secuencia de la proteína, la formación de la estructura secundaria depende de otros factores. Por ejemplo, se sabe que las tendencias en la estructura secundaria dependen también del entorno local,[13]​ la accesibilidad de los residuos a un disolvente,[14]​ la clase de la estructura proteica,[15]​ e incluso del organismo del que se obtienen las proteínas.[16]​ De acuerdo a tales observaciones, algunos estudios han mostrado que la predicción de la estructura secundaria puede mejorarse mediante la adición de información sobre la clase estructural de la proteína,[17]​ su accesibilidad al disolvente,[18][19]​ y también al número de contacto (una medida simple de la exposición al disolvente) de los residuos.[20]

Los métodos de covarianza sobre la secuencia dependen de la existencia de un conjunto de datos compuesto de múltiples secuencias homólogas de ARN, con secuencias relacionadas pero diferentes. Estos métodos analizan la covarianza de sitios de bases individuales en evolución. Que se mantengan pareados dos sitios de bases de nucleótidos ampliamente separados, indica la presencia entre esas posiciones de un puente de hidrógeno requerido estructuralmente. El problema general de la predicción de un pseudonudo ha demostrado ser NP-completo.[21]

Estructura terciaria

El papel práctico de la predicción de la estructura de las proteínas es ahora más importante que nunca. Los actuales esfuerzos en la secuenciación a gran escala, como el Proyecto Genoma Humano, generan cantidades masivas de secuencias de proteínas. A pesar de los enormes esfuerzos de la comunidad científica en genómica estructural, los resultados de la determinación experimental de las estructuras proteicas (normalmente mediante la muy laboriosa y relativamente cara cristalografía de rayos X, o por espectroscopia RMN) quedan rezagados tras la obtención de las secuencias proteicas.

La predicción de la estructura proteica sigue siendo una empresa extremadamente difícil e irresuelta. Los dos principales problemas son el cálculo de la energía libre de la proteína y la resolución del mínimo global de esta energía. Un método de predicción de estructura debe explorar el espacio de posibles estructuras proteicas, que es astronómicamente inmenso. Estos problemas pueden simplificarse con métodos de modelado por homología y de enhebrado de proteínas, donde el espacio de búsqueda se poda asumiendo que la proteína en cuestión adopta una estructura cercana a la determinada experimentalmente por otra proteína homóloga. Por su parte, los métodos de predicción de novo o ab initio deben resolver de forma explícita estos problemas.

Modelado ab initio

Los métodos de modelado ab initio (o de novo) tratan de construir modelos proteicos desde cero, basándose, por ejemplo, en principios físicos más que directamente en estructuras resueltas previamente. Hay bastantes procedimientos posibles que, o bien intentan imitar el plegado de proteínas, o bien aplican algún método estocástico para buscar posibles soluciones (por ejemplo, la optimización global de una función de energía apropiada). Estos procedimientos suelen requerir amplios recursos computacionales, y por lo tanto sólo han sido llevados a la práctica para pequeñas proteínas. Predecir de novo una estructura de una gran proteína requerirá mejores algoritmos y mayores recursos de computación, como los proporcionados por los supercomputadores (como el Blue Gene o el MDGRAPE-3) o la computación distribuida (como los proyectos Folding@home, Human Proteome Folding Project y Rosetta@home). Aunque estos inconvenientes computacionales son importantes, los beneficios potenciales de la genómica estructural (bien sea por predicción o por experimentación) hacen de la predicción ab initio de la estructura un campo activo de investigación.[22]

Como un paso intermedio hacia la predicción de estas estructuras proteicas, se han propuesto los mapas de contacto en las proteínas, que representan la distancia entre cada dos residuos de una estructura tridimensional utilizando una matriz bidimensional. Estas matrices proporcionan una representación más reducida que la estructura que incluye las coordenadas atómicas tridimensionales completas.

Modelado comparativo

El modelado comparativo de proteínas utiliza estructuras resueltas previamente como puntos de partida o plantillas. Es efectivo puesto que parece que, a pesar de la enorme cantidad de proteínas existente, hay un conjunto limitado de motivos estructurales terciarios a los que la mayoría de las proteínas se adhieren. Se ha sugerido que sólo existen alrededor de 2000 plegados proteicos diferentes en la naturaleza, mientras que existen varios millones de proteínas diferentes.

Estos métodos pueden ser divididos en dos grupos:[22]

  • Modelado por homología: se basa en la suposición razonable de que dos proteínas homólogas compartirán unas estructuras muy similares. Puesto que un plegado proteico está evolutivamente más conservado que su secuencia de aminoácidos, una secuencia objetivo puede ser modelada con una precisión razonable sobre una plantilla relacionada muy distante, siempre que la relación entre objetivo y plantilla sea perceptible en el alineamiento de sus secuencias. Se ha sugerido que el principal cuello de botella en el modelado comparativo proviene más de las dificultades en el alineamiento que de los errores en la predicción de la estructura dado un buen alineamiento.[23]​ De forma no sorpresiva, el modelado por homología es más preciso cuando el objetivo y la plantilla tienen secuencias similares.
  • Enhebrado de proteínas:[24]​ se contrasta la secuencia de aminoácidos de una estructura desconocida contra una base de datos de estructuras resueltas. En cada caso, se utiliza una función de puntuación para evaluar la compatibilidad de la secuencia a la estructura, obteniéndose así posibles modelos tridimensionales. Este tipo de método también se conoce como reconocimiento del plegado 3D-1D debido a la compatibilidad del análisis entre estructuras tridimensionales y secuencias proteicas lineales. Este método ha facilitado el desarrollo de otros que efectúan una búsqueda inversa del plegado evaluando la compatibilidad de una estructura dada contra una amplia base de datos de secuencias, prediciendo así qué secuencias tienen el potencial de producir un plegado determinado.

Predicción de la geometría de la cadena lateral

La configuración precisa del empaquetamientos de las cadenas laterales representa un problema adicional. Los métodos que trabajan específicamente el problema de la predicción de la geometría de la cadena lateral incluyen algoritmos para minimizar funciones sobre conjuntos de variables independientes discretas (dead-end elimination) y adaptaciones de la teoría de campo medio (campo medio autoconsistente). Las conformaciones con baja energía de la cadena lateral se determinan usualmente sobre el esqueleto rígido polipeptídico usando un conjunto de conformaciones discretas de cadenas laterales conocidas como rotámeros. Los métodos intentan identificar el conjunto de rotámeros que minimiza la energía global del modelo.

Para lo anterior se usan bibliotecas de rotámeros, que son, en definitiva, colecciones de conformaciones favorables multiángulo para cada tipo de residuo en proteínas. Las bibliotecas de rotámeros pueden contener información sobre la conformación, su frecuencia, y la varianza sobre la media de los ángulos diedros, que pueden utilizarse en el muestreo.[25]​ Estas bibliotecas se derivan de la bioinformática estructural u otros análisis estadísticos de conformaciones de cadenas laterales en estructuras de proteínas conocidas, tales como el agrupamiento de conformaciones observadas para carbonos tetraédricos cercanos a los valores de tambaleo (60º, 180º, -60º). Las bibliotecas de rotámeros pueden ser independientes del esqueleto, dependientes de la estructura secundaria, o dependientes del esqueleto. Las primeras no hacen referencia a la conformación del esqueleto de péptidos, y se calculan considerando todas las cadenas laterales disponibles de un determinado tipo (como en el primer ejemplo de biblioteca de rotámeros, realizado por Ponder y Richards en Yale en 1987).[26]​ Las bibliotecas dependientes de la estructura secundaria presentan ángulos diedros diferentes y/o frecuencias de rotámeros para hélices alfa, hojas beta, o estructuras secundarias en ovillo.[27][28]​ Por su parte, las bibliotecas dependientes del esqueleto presentan conformaciones y/o frecuencias dependientes de la conformación local del esqueleto, según queda definida por sus ángulos diedros   and  , sea cual sea la estructura secundaria.[29]​ Las versiones modernas de estas bibliotecas que se usan en la mayor parte del software, se presentan como distribuciones multidimensionales de probabilidad o frecuencia, donde los picos corresponden a las conformaciones de los ángulos diedros consideradas como rotámeros individuales en las listas. Algunas versiones son especialmente sensibles a las regiones prohibidas en ese espacio conformacional, y se usan básicamente para validación de la estructura,[30]​ mientras que otras enfatizan frecuencias relativas en las regiones favorables y son el tipo usado principalmente para la predicción de la estructura (como la biblioteca de rotámeros Dunbrack).

Los métodos de empaquetamiento de cadena lateral son más útiles para analizar las proteínas con núcleo hidrófobo, donde las cadenas laterales están empaquetadas con mayor cercanía; tienen más dificultad en afrontar las más holgadas restricciones y la mayor flexibilidad de los residuos superficiales, que a menudo alcanzan múltiples conformaciones de rotámeros en lugar de sólo una.[31]

Predicción de clases estructurales

Se han desarrollado métodos estadísticos para predecir clases estructurales de proteínas basados en su composición aminoacídica,[32]​ composición de seudoaminoácidos,[33][34][35][36]​ y composición de dominios funcionales.[37]

Estructura cuaternaria

En el caso de complejos de dos o más proteínas, y donde las estructuras de las proteínas sean conocidas o puedan predecirse con alta precisión, se pueden utilizar métodos de predicción de acoplamiento proteína-proteína para calcular la estructura del complejo. La información del efecto que posibles mutaciones en sitios específicos puedan tener sobre la afinidad del complejo, ayuda a entender la estructura agrupada y a desarrollar métodos de acoplamiento.

Programas

MODELLER es una popular herramienta de para generar modelos de homología utilizando metodología derivada de procesamiento de datos de espectroscopia RMN.SwissModel proporciona un servicio web automatizado para modelado básico por homología.

I-TASSER fue el mejor servidor para predicción de estructuras de proteínas en CASP7 y CASP8.

HHpred/HHsearch, bioinfo.pl, Robetta, y Phyre son herramientas software comunes para enhebrado de proteínas.

RAPTOR (software) es un programa para enhebrado de proteínas que se basa en programación con enteros.

Abalone es un programa basado en dinámica molecular para simular plegamientos con modelos de agua implícitos o explícitos.

TIP es una base de conocimiento de modelos STRUCTFAST[38]​ y relaciones precomputadas de similitud entre secuencias, estructuras, y sitios de acoplamiento. Se han implementado varios proyectos de computación distribuida relativos a la predicción de la estructura de las proteínas, tales com Folding@home, Rosetta@home, Human Proteome Folding Project, Predictor@home y TANPAKU.

El programa Foldit busca investigar las habilidades de reconocimiento de patrones y solución de rompecabezas inherentes a la mente humana, con el objetivo de crear software más exitoso para predicción de la estructura de las proteínas.

Las aproximaciones computacionales proporcionan una ruta alternativa rápida a la predicción de la estructura de los anticuerpos. Los algoritmos de predicción de estructura de alta resolución de la región FV de los anticuerpos, recientemente desarrollados (como RosettaAntibody) han demostrado generar modelos de homología de alta resolución, los cuales se han utilizado con éxito en predicciones de acoplamiento.[39]AlphaFold es un programa de inteligencia artificial (IA) desarrollado por DeepMind de Alphabets/Google,[40]​ que hace uso del aprendizaje profundo para prededir la estructura de proteínas.[41]​ AlphaFold 1 (2018) y AlphaFold 2 (2020) lograron los mejores resultados en CASP13 y CASP14 respectivamente.

Servidores para la predicción automática de la estructura

CASP, iniciales de Critical Assessment of Techniques for Protein Structure Prediction (evaluación crítica de técnicas de predicción de la estructura de proteínas), es un experimento orientado a una amplia comunidad que toma lugar cada dos años desde 1994. CASP proporciona a los usuarios e investigadores la oportunidad de valorar la calidad de los métodos y servidores automáticos disponibles para la predicción de la estructura de proteínas.

Véase también

Referencias

  1. «DeepMind and EMBL release the most complete database of predicted 3D structures of human proteins». EMBL (en inglés estadounidense). 22 de julio de 2021. Consultado el 23 de julio de 2021. 
  2. Tunyasuvunakool, Kathryn; Adler, Jonas; Wu, Zachary; Green, Tim; Zielinski, Michal; Žídek, Augustin; Bridgland, Alex; Cowie, Andrew et al. (22 de julio de 2021). «Highly accurate protein structure prediction for the human proteome». Nature (en inglés): 1-9. ISSN 1476-4687. doi:10.1038/s41586-021-03828-1. Consultado el 23 de julio de 2021. 
  3. Mount DM (2004). Bioinformatics: Sequence and Genome Analysis, 2, Cold Spring Harbor Laboratory Press. ISBN 0-87969-712-1.
  4. Guzzo, AV (1965). «Influence of Amino-Acid Sequence on Protein Structure». Biophysical Journal 5: 809-822. doi:10.1016/S0006-3495(65)86753-4. 
    Prothero, JW (1966). «Correlation between Distribution of Amino Acids and Alpha Helices». Biophysical Journal 6: 367-370. doi:10.1016/S0006-3495(66)86662-6. 
    Schiffer, M; Edmundson AB (1967). «Use of Helical Wheels to Represent Structures of Proteins and to Identify Segments with Helical Potential». Biophysical Journal 7: 121-?. doi:10.1016/S0006-3495(67)86579-2. 
    Kotelchuck, D; Scheraga HA (1969). «The Influence of Short-Range Interactions on Protein Conformation, II. A Model for Predicting the α-Helical Regions of Proteins». Proceedings of the National Academy of Science USA 62 (1): 14-21. PMC 285948. PMID 5253650. doi:10.1073/pnas.62.1.14. 
    Lewis, PN; Gō N, Gō M, Kotelchuck D, Scheraga HA (1970). «Helix Probability Profiles of Denatured Proteins and Their Correlation with Native Structures». Proceedings of the National Academy of Science USA 65 (4): 810-815. PMC 282987. PMID 5266152. doi:10.1073/pnas.65.4.810. 
  5. Froimowitz M, Fasman GD. (1974). Prediction of the secondary structure of proteins using the helix-coil transition theory. Macromolecules 7(5):583-9.
  6. Dor O, Zhou Y. (2006). Achieving 80% tenfold cross-validated accuracy for secondary structure prediction by large-scale training. Proteins Epub. PMID 17177203
  7. Chou PY, Fasman GD. (1974). Prediction of protein conformation. Biochemistry. 13(2):222-45.
  8. Garnier J, Osguthorpe DJ, Robson B. (1978). Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins. J Mol Biol 120:97-120.
  9. Pham TH, Satou K, Ho TB. (2005). Support vector machines for prediction and analysis of beta and gamma-turns in proteins. J Bioinform Comput Biol 3(2):343-58. PMID 15852509
  10. Zhang Q, Yoon S, Welsh WJ. (2005). Improved method for predicting beta-turn using support vector machine. Bioinformatics 21(10):2370-4. PMID 15797917
  11. Zimmermann O, Hansmann UH. (2006). Support vector machines for prediction of dihedral angle regions. Bioinformatics 22(24):3009-15. PMID 17005536
  12. Kuang R, Leslie CS, Yang AS. (2004). Protein backbone angle prediction with machine learning approaches. Bioinformatics 20(10):1612-21. PMID 14988121
  13. Zhong L, Johnson WC Jr. (1992). Environment affects amino acid preference for secondary structure. Proc Natl Acad Sci USA 89(10):4462-5. PMID 1584778
  14. Macdonald JR, Johnson WC Jr. (2001). Environmental features are important in determining protein secondary structure. Protein Sci. 10(6):1172-7. PMID 11369855
  15. Costantini S, Colonna G, Facchiano AM. (2006). Amino acid propensities for secondary structures are influenced by the protein structural class. Biochem Biophys Res Commun. 342(2):441-51. PMID 16487481
  16. Marashi SA, et al. (2007). Adaptation of proteins to different environments: a comparison of proteome structural properties in Bacillus subtilis and Escherichia coli. J Theor Biol 244(1):127-32. PMID 16945389
  17. Costantini S, Colonna G, Facchiano AM. (2007). PreSSAPro: a software for the prediction of secondary structure by amino acid properties. Comput Biol Chem 31(5-6):389-92. PMID 17888742
  18. Momen-Roknabadi A, et al. (2008). Impact of residue accessible surface area on the prediction of protein secondary structures. BMC Bioinformatics. 9:357. PMID 18759992
  19. Adamczak R, Porollo A, Meller J. (2005). Combining prediction of secondary structure and solvent accessibility in proteins. Proteins 59(3):467-75. PMID 15768403
  20. Lakizadeh A, Marashi SA. (2009). Addition of contact number information can improve protein secondary structure prediction by neural networks. EXCLI J. 8:66-73.
  21. Lyngsø RB, Pedersen CN. (2000). RNA pseudoknot prediction in energy-based models. J Comput Biol 7(3-4): 409-427.
  22. Zhang Y (2008). «Progress and challenges in protein structure prediction». Curr Opin Struct Biol 18 (3): 342-348. PMC 2680823. PMID 18436442. doi:10.1016/j.sbi.2008.02.004. Entrez PubMed 18436442. 
  23. Zhang Y and Skolnick J (2005). «The protein structure prediction problem could be solved using the current PDB library». Proc Natl Acad Sci USA 102 (4): 1029-1034. PMC 545829. PMID 15653774. doi:10.1073/pnas.0407152101. Entrez PubMed 15653774. 
  24. Bowie JU, Luthy R, Eisenberg D (1991). «A method to identify protein sequences that fold into a known three-dimensional structure». Science 253 (5016): 164-170. PMID 1853201. doi:10.1126/science.1853201. Entrez PubMed 1853201. 
  25. Dunbrack, RL (2002). «Rotamer Libraries in the 21st Century». Curr. Opin. Struct. Biol. 12 (4): 431-440. PMID 12163064. doi:10.1016/S0959-440X(02)00344-5. 
  26. Ponder JW, Richards FM (1987). «Tertiary templates for proteins: use of packing criteria in the enumeration of allowed sequences for different structural classes». J. Mol. Biol. 193: 775-791. 
  27. Lovell SC, Word JM, Richardson JS, Richardson DC (2000). «The penultimate rotamer library». Proteins: Struc. Func. Genet. 40: 389-408. doi:10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2. 
  28. Richardson Rotamer Libraries
  29. Dunbrack Rotamer Libraries
  30. MolProbity
  31. Voigt CA, Gordon DB, Mayo SL (2000). «Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design». J Mol Biol 299 (3): 789-803. PMID 10835284. doi:10.1006/jmbi.2000.3758. Entrez PubMed 10835284. 
  32. Chou KC, Zhang CT (1995). «Prediction of protein structural classes». Crit. Rev. Biochem. Mol. Biol. 30 (4): 275-349. PMID 7587280. doi:10.3109/10409239509083488. 
  33. Chen C, Zhou X, Tian Y, Zou X, Cai P (octubre de 2006). «Predicting protein structural class with pseudo-amino acid composition and support vector machine fusion network». Anal. Biochem. 357 (1): 116-21. PMID 16920060. doi:10.1016/j.ab.2006.07.022. 
  34. Chen C, Tian YX, Zou XY, Cai PX, Mo JY (diciembre de 2006). «Using pseudo-amino acid composition and support vector machine to predict protein structural class». J. Theor. Biol. 243 (3): 444-8. PMID 16908032. doi:10.1016/j.jtbi.2006.06.025. 
  35. Lin H, Li QZ (julio de 2007). «Using pseudo amino acid composition to predict protein structural class: approached by incorporating 400 dipeptide components». J Comput Chem 28 (9): 1463-6. PMID 17330882. doi:10.1002/jcc.20554. 
  36. Xiao X, Wang P, Chou KC (octubre de 2008). «Predicting protein structural classes with pseudo amino acid composition: an approach using geometric moments of cellular automaton image». J. Theor. Biol. 254 (3): 691-6. PMID 18634802. doi:10.1016/j.jtbi.2008.06.016. 
  37. Chou KC, Cai YD (septiembre de 2004). «Predicting protein structural class by functional domain composition». Biochem. Biophys. Res. Commun. 321 (4): 1007-9. PMID 15358128. doi:10.1016/j.bbrc.2004.07.059. 
  38. Debe DA, Danzer JF, Goddard WA, Poleksic A (2006). «STRUCTFAST: Protein sequence remote homology detection and alignment using novel dynamic programming and profile-profile scoring». Proteins 64 (4): 960-967. PMID 16786595. doi:10.1002/prot.21049. Entrez PubMed 16786595. 
  39. Sivasubramanian A, Sircar A, Chaudhury S, Gray J J (2009). «Toward high-resolution homology modeling of antibody Fv regions and application to antibody–antigen docking». Proteins 74 (2): 497-514. PMID 19062174. doi:10.1002/prot.22309. 
  40. «AlphaFold». Deepmind (en inglés). Consultado el 30 de noviembre de 2020. 
  41. «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020. 

Enlaces externos

  • Predicción de la estructura de las proteínas
  • Página web de CASP
  • ExPASy Proteomics tools — Lista de herramientas de predicción y servidores
  • — London's Global University
  • DOMpro — University of California Irvine
  • DomainSplit — University of Pittsburgh
  • — University at Buffalo
  • — University of Missouri Columbia
  • PredictProtein
  • - Estructura de las proteínas comparativa y de novo, y servidor de modelado de complejos
  • SCRATCH - Paquete para la predicción de estructura en proteínas que incluye SSpro
  •   Datos: Q899656

predicción, estructura, proteínas, predicción, estructura, proteínas, predicción, cálculo, estructura, tridimensional, proteína, desde, secuencia, aminoácidos, decir, predicción, estructuras, secundaria, terciaria, desde, estructura, primaria, predicción, estr. La prediccion de la estructura de las proteinas es la prediccion o calculo de la estructura tridimensional de una proteina desde su secuencia de aminoacidos es decir la prediccion de sus estructuras secundaria y terciaria desde su estructura primaria La prediccion de la estructura es fundamentalmente diferente del problema inverso del diseno de proteinas Es uno de los principales objetivos de la bioinformatica y de la quimica teorica y altamente importante en medicina en diseno de farmacos por ejemplo y biotecnologia en el diseno de nuevas enzimas por ejemplo Existen dos estrategias basicas para aproximarse a la prediccion de la estructura la prediccion de novo en la que se suelen utilizar metodos estocasticos y la prediccion por comparacion en la que se recurre a una biblioteca de estructuras previamente conocidas Cada dos anos se evalua el rendimiento de los metodos actuales en el experimento CASP Critical Assessment of Techniques for Protein Structure Prediction Evaluacion Critica de Tecnicas para la Prediccion de la Estructura de las Proteinas En julio de 2021 DeepMind y EMBL Laboratorio Europeo de Biologia Molecular publican la prediccion mas de 350 000 estructuras tridimensionales de proteinas 1 2 Indice 1 Estructura secundaria 1 1 Antecedentes 1 2 Metodo de Chou Fasman 1 3 Metodo GOR 1 4 Aprendizaje automatico 1 5 Otras mejoras 2 Estructura terciaria 2 1 Modelado ab initio 2 2 Modelado comparativo 2 3 Prediccion de la geometria de la cadena lateral 2 4 Prediccion de clases estructurales 3 Estructura cuaternaria 4 Programas 4 1 Servidores para la prediccion automatica de la estructura 5 Vease tambien 6 Referencias 7 Enlaces externosEstructura secundaria EditarLa prediccion de la estructura secundaria es un conjunto de tecnicas bioinformaticas cuyo objetivo es predecir la estructura secundaria local de secuencias de proteinas y ARN basandose solo en el conocimiento de su estructura primaria de aminoacidos o de nucleotidos respectivamente Para las proteinas una prediccion consiste en asignar regiones como probables helices alfa hebras beta denominadas a menudo conformaciones extendidas o bucles beta El exito de una prediccion se determina por su comparacion con los resultados de aplicar el algoritmo DSSP metodo estandar para asignar una estructura secundaria a los aminoacidos de una proteina dadas sus coordenadas atomicas de resolucion a la estructura cristalina de la proteina Para acidos nucleicos podria determinarse por el patron de puentes de hidrogeno Se han desarrollado algoritmos para la deteccion de patrones especificos bien definidos tales como helices transmembrana y helices superenrolladas en las proteinas o estructuras de microARN en el ARN 3 Los mejores metodos modernos de prediccion de estructura secundaria en proteinas alcanzan alrededor del 80 de precision Tan alto porcentaje permite el uso de las predicciones en el enhebrado de proteinas y la prediccion de la estructura proteica ab initio la clasificacion de motivos estructurales y el refinamiento de los alineamientos de secuencias La precision de los metodos actuales de prediccion de la estructura secundaria se evalua en comparaciones semanales tales como LiveBench y EVA Antecedentes Editar Los metodos iniciales de prediccion de la estructura secundaria introducidos en la decada de los 60 y los primeros 70 del siglo XX 4 se centraron en la identificacion de posibles helices alfa y se basaron principalmente en modelos de transicion helice ovillo 5 En los 70 se introdujeron predicciones significativamente mas precisas que incluian hojas beta Su fundamento se encontraba en evaluaciones estadisticas basadas en parametros de probabilidad derivados de estructuras resueltas conocidas Estos metodos aplicados a una unica secuencia tienen como mucho una precision del 60 65 aunque a menudo no predicen correctamente las hojas beta 3 La conservacion evolutiva de estructuras secundarias puede ser aprovechada mediante la evaluacion simultanea de varias secuencias homologas en un alineamiento multiple de secuencias calculando asi la propension de una secuencia de aminoacidos alineada a formar redes de estructura secundaria Conjuntando estos metodos con grandes bases de datos de estructuras proteicas conocidas y con los metodos actuales de aprendizaje automatico tales como redes neuronales artificiales y maquinas de soporte vectorial puede alcanzarse hasta un 80 de precision en proteinas globulares 6 El limite teorico superior de precision se encuentra alrededor del 90 6 debido en parte a la idiosincrasia en la asignacion del DSSP cerca de los extremos de las estructuras secundarias donde las conformaciones locales varian bajo condiciones nativas pero pueden forzarse para asumir una unica conformacion cristalina debido a las restricciones del empaquetado Tambien impone restricciones la incapacidad de la prediccion de la estructura secundaria de tomar en cuenta la estructura terciaria Por ejemplo una secuencia predicha como probable helice puede ser capaz todavia de adoptar una conformacion de hebra beta si esta localizada dentro de una region hoja beta de la proteina y sus cadenas laterales encajan bien con sus vecinas Los cambios conformacionales drasticos relacionados con la funcion o el entorno de la proteina pueden alterar tambien la estructura secundaria local Metodo de Chou Fasman Editar El metodo de Chou Fasman fue uno de los primeros algoritmos desarrollados para la prediccion de la estructura secundaria y se fundamenta predominantemente sobre parametros de probabilidad determinados por las frecuencias relativas de las apariciones de cada aminoacido en cada tipo de estructura secundaria 7 Los parametros originales del Chou Fasman determinados desde el pequeno conjunto de estructuras resueltas a mediados de los 70 producen resultados pobres en comparacion con los obtenidos por los metodos modernos aunque la parametrizacion haya sido actualizada desde su primera publicacion El metodo Chou Fasman es preciso aproximadamente en un 50 60 en la prediccion de estructuras secundarias 3 Metodo GOR Editar Articulo principal Metodo GOR El metodo GOR asi denominado por los tres cientificos que lo desarrollaron Garnier Osguthorpe y Robson es un metodo basado en la teoria de la informacion desarrollado no mucho despues del Chou Fasman y usa tecnicas probabilisticas mas apropiadas de inferencia bayesiana 8 Este metodo toma en consideracion no solo la probabilidad de que cada aminoacido tenga una particular estructura secundaria sino tambien la probabilidad condicional de que el aminoacido asuma cada estructura considerando que sus vecinos asuman la misma estructura Este metodo es mas sensible y preciso puesto que las tendencias estructurales de los aminoacidos son considerables solo para un pequeno numero de estas moleculas tales como la prolina y la glicina El metodo GOR original es preciso en aproximadamente el 65 y muchisimo mas exitoso en la prediccion de helices alfa que hojas beta que frecuentemente son calculadas erroneamente como bucles o como regiones desorganizadas 3 Aprendizaje automatico Editar Los metodos basados en redes neuronales artificiales utilizan conjuntos de entrenamiento cuyos elementos son estructuras resueltas para identificar secuencias motivo comunes asociadas con disposiciones particulares de estructuras secundarias Estos metodos estan sobre el 70 de precision en sus predicciones aunque las hebras beta todavia vienen siendo predichas en poca medida debido a la carencia de informacion estructural tridimensional que pudiera permitir la evaluacion de los patrones de puentes de hidrogeno con los que pudiera promoverse la formacion de la conformacion extendida requerida para la presencia de una hoja beta completa 3 Las maquinas de soporte vectorial MSV han demostrado ser particularmente utiles en la prediccion de las localizaciones de los bucles que son dificiles de identificar con metodos estadisticos 9 Se ha citado tambien la necesidad de relativamente pequenos conjuntos de entrenamiento como una ventaja para evitar un excesivo ajuste sobre los datos estructurales existentes 10 Algunas extensiones a las tecnicas de aprendizaje automatico intentan predecir propiedades locales de granularidad mas fina en las proteinas como los angulos diedros en determinadas regiones del esqueleto de las proteinas Se han aplicado a este problema tanto MSVs 11 como redes neuronales 12 Otras mejoras Editar Ademas de la secuencia de la proteina la formacion de la estructura secundaria depende de otros factores Por ejemplo se sabe que las tendencias en la estructura secundaria dependen tambien del entorno local 13 la accesibilidad de los residuos a un disolvente 14 la clase de la estructura proteica 15 e incluso del organismo del que se obtienen las proteinas 16 De acuerdo a tales observaciones algunos estudios han mostrado que la prediccion de la estructura secundaria puede mejorarse mediante la adicion de informacion sobre la clase estructural de la proteina 17 su accesibilidad al disolvente 18 19 y tambien al numero de contacto una medida simple de la exposicion al disolvente de los residuos 20 Los metodos de covarianza sobre la secuencia dependen de la existencia de un conjunto de datos compuesto de multiples secuencias homologas de ARN con secuencias relacionadas pero diferentes Estos metodos analizan la covarianza de sitios de bases individuales en evolucion Que se mantengan pareados dos sitios de bases de nucleotidos ampliamente separados indica la presencia entre esas posiciones de un puente de hidrogeno requerido estructuralmente El problema general de la prediccion de un pseudonudo ha demostrado ser NP completo 21 Estructura terciaria EditarEl papel practico de la prediccion de la estructura de las proteinas es ahora mas importante que nunca Los actuales esfuerzos en la secuenciacion a gran escala como el Proyecto Genoma Humano generan cantidades masivas de secuencias de proteinas A pesar de los enormes esfuerzos de la comunidad cientifica en genomica estructural los resultados de la determinacion experimental de las estructuras proteicas normalmente mediante la muy laboriosa y relativamente cara cristalografia de rayos X o por espectroscopia RMN quedan rezagados tras la obtencion de las secuencias proteicas La prediccion de la estructura proteica sigue siendo una empresa extremadamente dificil e irresuelta Los dos principales problemas son el calculo de la energia libre de la proteina y la resolucion del minimo global de esta energia Un metodo de prediccion de estructura debe explorar el espacio de posibles estructuras proteicas que es astronomicamente inmenso Estos problemas pueden simplificarse con metodos de modelado por homologia y de enhebrado de proteinas donde el espacio de busqueda se poda asumiendo que la proteina en cuestion adopta una estructura cercana a la determinada experimentalmente por otra proteina homologa Por su parte los metodos de prediccion de novo o ab initio deben resolver de forma explicita estos problemas Modelado ab initio Editar Los metodos de modelado ab initio o de novo tratan de construir modelos proteicos desde cero basandose por ejemplo en principios fisicos mas que directamente en estructuras resueltas previamente Hay bastantes procedimientos posibles que o bien intentan imitar el plegado de proteinas o bien aplican algun metodo estocastico para buscar posibles soluciones por ejemplo la optimizacion global de una funcion de energia apropiada Estos procedimientos suelen requerir amplios recursos computacionales y por lo tanto solo han sido llevados a la practica para pequenas proteinas Predecir de novo una estructura de una gran proteina requerira mejores algoritmos y mayores recursos de computacion como los proporcionados por los supercomputadores como el Blue Gene o el MDGRAPE 3 o la computacion distribuida como los proyectos Folding home Human Proteome Folding Project y Rosetta home Aunque estos inconvenientes computacionales son importantes los beneficios potenciales de la genomica estructural bien sea por prediccion o por experimentacion hacen de la prediccion ab initio de la estructura un campo activo de investigacion 22 Como un paso intermedio hacia la prediccion de estas estructuras proteicas se han propuesto los mapas de contacto en las proteinas que representan la distancia entre cada dos residuos de una estructura tridimensional utilizando una matriz bidimensional Estas matrices proporcionan una representacion mas reducida que la estructura que incluye las coordenadas atomicas tridimensionales completas Modelado comparativo Editar El modelado comparativo de proteinas utiliza estructuras resueltas previamente como puntos de partida o plantillas Es efectivo puesto que parece que a pesar de la enorme cantidad de proteinas existente hay un conjunto limitado de motivos estructurales terciarios a los que la mayoria de las proteinas se adhieren Se ha sugerido que solo existen alrededor de 2000 plegados proteicos diferentes en la naturaleza mientras que existen varios millones de proteinas diferentes Estos metodos pueden ser divididos en dos grupos 22 Modelado por homologia se basa en la suposicion razonable de que dos proteinas homologas compartiran unas estructuras muy similares Puesto que un plegado proteico esta evolutivamente mas conservado que su secuencia de aminoacidos una secuencia objetivo puede ser modelada con una precision razonable sobre una plantilla relacionada muy distante siempre que la relacion entre objetivo y plantilla sea perceptible en el alineamiento de sus secuencias Se ha sugerido que el principal cuello de botella en el modelado comparativo proviene mas de las dificultades en el alineamiento que de los errores en la prediccion de la estructura dado un buen alineamiento 23 De forma no sorpresiva el modelado por homologia es mas preciso cuando el objetivo y la plantilla tienen secuencias similares Enhebrado de proteinas 24 se contrasta la secuencia de aminoacidos de una estructura desconocida contra una base de datos de estructuras resueltas En cada caso se utiliza una funcion de puntuacion para evaluar la compatibilidad de la secuencia a la estructura obteniendose asi posibles modelos tridimensionales Este tipo de metodo tambien se conoce como reconocimiento del plegado 3D 1D debido a la compatibilidad del analisis entre estructuras tridimensionales y secuencias proteicas lineales Este metodo ha facilitado el desarrollo de otros que efectuan una busqueda inversa del plegado evaluando la compatibilidad de una estructura dada contra una amplia base de datos de secuencias prediciendo asi que secuencias tienen el potencial de producir un plegado determinado Prediccion de la geometria de la cadena lateral Editar La configuracion precisa del empaquetamientos de las cadenas laterales representa un problema adicional Los metodos que trabajan especificamente el problema de la prediccion de la geometria de la cadena lateral incluyen algoritmos para minimizar funciones sobre conjuntos de variables independientes discretas dead end elimination y adaptaciones de la teoria de campo medio campo medio autoconsistente Las conformaciones con baja energia de la cadena lateral se determinan usualmente sobre el esqueleto rigido polipeptidico usando un conjunto de conformaciones discretas de cadenas laterales conocidas como rotameros Los metodos intentan identificar el conjunto de rotameros que minimiza la energia global del modelo Para lo anterior se usan bibliotecas de rotameros que son en definitiva colecciones de conformaciones favorables multiangulo para cada tipo de residuo en proteinas Las bibliotecas de rotameros pueden contener informacion sobre la conformacion su frecuencia y la varianza sobre la media de los angulos diedros que pueden utilizarse en el muestreo 25 Estas bibliotecas se derivan de la bioinformatica estructural u otros analisis estadisticos de conformaciones de cadenas laterales en estructuras de proteinas conocidas tales como el agrupamiento de conformaciones observadas para carbonos tetraedricos cercanos a los valores de tambaleo 60º 180º 60º Las bibliotecas de rotameros pueden ser independientes del esqueleto dependientes de la estructura secundaria o dependientes del esqueleto Las primeras no hacen referencia a la conformacion del esqueleto de peptidos y se calculan considerando todas las cadenas laterales disponibles de un determinado tipo como en el primer ejemplo de biblioteca de rotameros realizado por Ponder y Richards en Yale en 1987 26 Las bibliotecas dependientes de la estructura secundaria presentan angulos diedros diferentes y o frecuencias de rotameros para helices alfa hojas beta o estructuras secundarias en ovillo 27 28 Por su parte las bibliotecas dependientes del esqueleto presentan conformaciones y o frecuencias dependientes de la conformacion local del esqueleto segun queda definida por sus angulos diedros ϕ displaystyle phi and ps displaystyle psi sea cual sea la estructura secundaria 29 Las versiones modernas de estas bibliotecas que se usan en la mayor parte del software se presentan como distribuciones multidimensionales de probabilidad o frecuencia donde los picos corresponden a las conformaciones de los angulos diedros consideradas como rotameros individuales en las listas Algunas versiones son especialmente sensibles a las regiones prohibidas en ese espacio conformacional y se usan basicamente para validacion de la estructura 30 mientras que otras enfatizan frecuencias relativas en las regiones favorables y son el tipo usado principalmente para la prediccion de la estructura como la biblioteca de rotameros Dunbrack Los metodos de empaquetamiento de cadena lateral son mas utiles para analizar las proteinas con nucleo hidrofobo donde las cadenas laterales estan empaquetadas con mayor cercania tienen mas dificultad en afrontar las mas holgadas restricciones y la mayor flexibilidad de los residuos superficiales que a menudo alcanzan multiples conformaciones de rotameros en lugar de solo una 31 Prediccion de clases estructurales Editar Se han desarrollado metodos estadisticos para predecir clases estructurales de proteinas basados en su composicion aminoacidica 32 composicion de seudoaminoacidos 33 34 35 36 y composicion de dominios funcionales 37 Estructura cuaternaria EditarArticulo principal Prediccion de acoplamiento proteina proteina En el caso de complejos de dos o mas proteinas y donde las estructuras de las proteinas sean conocidas o puedan predecirse con alta precision se pueden utilizar metodos de prediccion de acoplamiento proteina proteina para calcular la estructura del complejo La informacion del efecto que posibles mutaciones en sitios especificos puedan tener sobre la afinidad del complejo ayuda a entender la estructura agrupada y a desarrollar metodos de acoplamiento Programas EditarMODELLER es una popular herramienta de para generar modelos de homologia utilizando metodologia derivada de procesamiento de datos de espectroscopia RMN SwissModel proporciona un servicio web automatizado para modelado basico por homologia I TASSER fue el mejor servidor para prediccion de estructuras de proteinas en CASP7 y CASP8 HHpred HHsearch bioinfo pl Robetta y Phyre son herramientas software comunes para enhebrado de proteinas RAPTOR software es un programa para enhebrado de proteinas que se basa en programacion con enteros Abalone es un programa basado en dinamica molecular para simular plegamientos con modelos de agua implicitos o explicitos TIP es una base de conocimiento de modelos STRUCTFAST 38 y relaciones precomputadas de similitud entre secuencias estructuras y sitios de acoplamiento Se han implementado varios proyectos de computacion distribuida relativos a la prediccion de la estructura de las proteinas tales com Folding home Rosetta home Human Proteome Folding Project Predictor home y TANPAKU El programa Foldit busca investigar las habilidades de reconocimiento de patrones y solucion de rompecabezas inherentes a la mente humana con el objetivo de crear software mas exitoso para prediccion de la estructura de las proteinas Las aproximaciones computacionales proporcionan una ruta alternativa rapida a la prediccion de la estructura de los anticuerpos Los algoritmos de prediccion de estructura de alta resolucion de la region FV de los anticuerpos recientemente desarrollados como RosettaAntibody han demostrado generar modelos de homologia de alta resolucion los cuales se han utilizado con exito en predicciones de acoplamiento 39 AlphaFold es un programa de inteligencia artificial IA desarrollado por DeepMind de Alphabets Google 40 que hace uso del aprendizaje profundo para prededir la estructura de proteinas 41 AlphaFold 1 2018 y AlphaFold 2 2020 lograron los mejores resultados en CASP13 y CASP14 respectivamente Servidores para la prediccion automatica de la estructura Editar Articulo principal CASP CASP iniciales de Critical Assessment of Techniques for Protein Structure Prediction evaluacion critica de tecnicas de prediccion de la estructura de proteinas es un experimento orientado a una amplia comunidad que toma lugar cada dos anos desde 1994 CASP proporciona a los usuarios e investigadores la oportunidad de valorar la calidad de los metodos y servidores automaticos disponibles para la prediccion de la estructura de proteinas Vease tambien EditarSIMAPReferencias Editar DeepMind and EMBL release the most complete database of predicted 3D structures of human proteins EMBL en ingles estadounidense 22 de julio de 2021 Consultado el 23 de julio de 2021 Tunyasuvunakool Kathryn Adler Jonas Wu Zachary Green Tim Zielinski Michal Zidek Augustin Bridgland Alex Cowie Andrew et al 22 de julio de 2021 Highly accurate protein structure prediction for the human proteome Nature en ingles 1 9 ISSN 1476 4687 doi 10 1038 s41586 021 03828 1 Consultado el 23 de julio de 2021 Se sugiere usar numero autores ayuda a b c d e Mount DM 2004 Bioinformatics Sequence and Genome Analysis 2 Cold Spring Harbor Laboratory Press ISBN 0 87969 712 1 Guzzo AV 1965 Influence of Amino Acid Sequence on Protein Structure Biophysical Journal 5 809 822 doi 10 1016 S0006 3495 65 86753 4 Prothero JW 1966 Correlation between Distribution of Amino Acids and Alpha Helices Biophysical Journal 6 367 370 doi 10 1016 S0006 3495 66 86662 6 Schiffer M Edmundson AB 1967 Use of Helical Wheels to Represent Structures of Proteins and to Identify Segments with Helical Potential Biophysical Journal 7 121 doi 10 1016 S0006 3495 67 86579 2 Kotelchuck D Scheraga HA 1969 The Influence of Short Range Interactions on Protein Conformation II A Model for Predicting the a Helical Regions of Proteins Proceedings of the National Academy of Science USA 62 1 14 21 PMC 285948 PMID 5253650 doi 10 1073 pnas 62 1 14 Lewis PN Gō N Gō M Kotelchuck D Scheraga HA 1970 Helix Probability Profiles of Denatured Proteins and Their Correlation with Native Structures Proceedings of the National Academy of Science USA 65 4 810 815 PMC 282987 PMID 5266152 doi 10 1073 pnas 65 4 810 La referencia utiliza el parametro obsoleto coautores ayuda Froimowitz M Fasman GD 1974 Prediction of the secondary structure of proteins using the helix coil transition theory Macromolecules 7 5 583 9 a b Dor O Zhou Y 2006 Achieving 80 tenfold cross validated accuracy for secondary structure prediction by large scale training Proteins Epub PMID 17177203 Chou PY Fasman GD 1974 Prediction of protein conformation Biochemistry 13 2 222 45 Garnier J Osguthorpe DJ Robson B 1978 Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins J Mol Biol 120 97 120 Pham TH Satou K Ho TB 2005 Support vector machines for prediction and analysis of beta and gamma turns in proteins J Bioinform Comput Biol 3 2 343 58 PMID 15852509 Zhang Q Yoon S Welsh WJ 2005 Improved method for predicting beta turn using support vector machine Bioinformatics 21 10 2370 4 PMID 15797917 Zimmermann O Hansmann UH 2006 Support vector machines for prediction of dihedral angle regions Bioinformatics 22 24 3009 15 PMID 17005536 Kuang R Leslie CS Yang AS 2004 Protein backbone angle prediction with machine learning approaches Bioinformatics 20 10 1612 21 PMID 14988121 Zhong L Johnson WC Jr 1992 Environment affects amino acid preference for secondary structure Proc Natl Acad Sci USA 89 10 4462 5 PMID 1584778 Macdonald JR Johnson WC Jr 2001 Environmental features are important in determining protein secondary structure Protein Sci 10 6 1172 7 PMID 11369855 Costantini S Colonna G Facchiano AM 2006 Amino acid propensities for secondary structures are influenced by the protein structural class Biochem Biophys Res Commun 342 2 441 51 PMID 16487481 Marashi SA et al 2007 Adaptation of proteins to different environments a comparison of proteome structural properties in Bacillus subtilis and Escherichia coli J Theor Biol 244 1 127 32 PMID 16945389 Costantini S Colonna G Facchiano AM 2007 PreSSAPro a software for the prediction of secondary structure by amino acid properties Comput Biol Chem 31 5 6 389 92 PMID 17888742 Momen Roknabadi A et al 2008 Impact of residue accessible surface area on the prediction of protein secondary structures BMC Bioinformatics 9 357 PMID 18759992 Adamczak R Porollo A Meller J 2005 Combining prediction of secondary structure and solvent accessibility in proteins Proteins 59 3 467 75 PMID 15768403 Lakizadeh A Marashi SA 2009 Addition of contact number information can improve protein secondary structure prediction by neural networks EXCLI J 8 66 73 Lyngso RB Pedersen CN 2000 RNA pseudoknot prediction in energy based models J Comput Biol 7 3 4 409 427 a b Zhang Y 2008 Progress and challenges in protein structure prediction Curr Opin Struct Biol 18 3 342 348 PMC 2680823 PMID 18436442 doi 10 1016 j sbi 2008 02 004 Entrez PubMed 18436442 Zhang Y and Skolnick J 2005 The protein structure prediction problem could be solved using the current PDB library Proc Natl Acad Sci USA 102 4 1029 1034 PMC 545829 PMID 15653774 doi 10 1073 pnas 0407152101 Entrez PubMed 15653774 Bowie JU Luthy R Eisenberg D 1991 A method to identify protein sequences that fold into a known three dimensional structure Science 253 5016 164 170 PMID 1853201 doi 10 1126 science 1853201 Entrez PubMed 1853201 Dunbrack RL 2002 Rotamer Libraries in the 21st Century Curr Opin Struct Biol 12 4 431 440 PMID 12163064 doi 10 1016 S0959 440X 02 00344 5 Ponder JW Richards FM 1987 Tertiary templates for proteins use of packing criteria in the enumeration of allowed sequences for different structural classes J Mol Biol 193 775 791 Lovell SC Word JM Richardson JS Richardson DC 2000 The penultimate rotamer library Proteins Struc Func Genet 40 389 408 doi 10 1002 1097 0134 20000815 40 3 lt 389 AID PROT50 gt 3 0 CO 2 2 Richardson Rotamer Libraries Dunbrack Rotamer Libraries MolProbity Voigt CA Gordon DB Mayo SL 2000 Trading accuracy for speed A quantitative comparison of search algorithms in protein sequence design J Mol Biol 299 3 789 803 PMID 10835284 doi 10 1006 jmbi 2000 3758 Entrez PubMed 10835284 Chou KC Zhang CT 1995 Prediction of protein structural classes Crit Rev Biochem Mol Biol 30 4 275 349 PMID 7587280 doi 10 3109 10409239509083488 Chen C Zhou X Tian Y Zou X Cai P octubre de 2006 Predicting protein structural class with pseudo amino acid composition and support vector machine fusion network Anal Biochem 357 1 116 21 PMID 16920060 doi 10 1016 j ab 2006 07 022 Chen C Tian YX Zou XY Cai PX Mo JY diciembre de 2006 Using pseudo amino acid composition and support vector machine to predict protein structural class J Theor Biol 243 3 444 8 PMID 16908032 doi 10 1016 j jtbi 2006 06 025 Lin H Li QZ julio de 2007 Using pseudo amino acid composition to predict protein structural class approached by incorporating 400 dipeptide components J Comput Chem 28 9 1463 6 PMID 17330882 doi 10 1002 jcc 20554 Xiao X Wang P Chou KC octubre de 2008 Predicting protein structural classes with pseudo amino acid composition an approach using geometric moments of cellular automaton image J Theor Biol 254 3 691 6 PMID 18634802 doi 10 1016 j jtbi 2008 06 016 Chou KC Cai YD septiembre de 2004 Predicting protein structural class by functional domain composition Biochem Biophys Res Commun 321 4 1007 9 PMID 15358128 doi 10 1016 j bbrc 2004 07 059 Debe DA Danzer JF Goddard WA Poleksic A 2006 STRUCTFAST Protein sequence remote homology detection and alignment using novel dynamic programming and profile profile scoring Proteins 64 4 960 967 PMID 16786595 doi 10 1002 prot 21049 Entrez PubMed 16786595 Sivasubramanian A Sircar A Chaudhury S Gray J J 2009 Toward high resolution homology modeling of antibody Fv regions and application to antibody antigen docking Proteins 74 2 497 514 PMID 19062174 doi 10 1002 prot 22309 AlphaFold Deepmind en ingles Consultado el 30 de noviembre de 2020 DeepMind s protein folding AI has solved a 50 year old grand challenge of biology MIT Technology Review en ingles Consultado el 30 de noviembre de 2020 Enlaces externos EditarPrediccion de la estructura de las proteinasPagina web de CASPExPASy Proteomics tools Lista de herramientas de prediccion y servidores DomPred London s Global University DOMpro University of California Irvine DomainSplit University of Pittsburgh Meta DP University at Buffalo DOMAC University of Missouri Columbia PredictProtein Protinfo Estructura de las proteinas comparativa y de novo y servidor de modelado de complejos SCRATCH Paquete para la prediccion de estructura en proteinas que incluye SSpro Datos Q899656 Obtenido de https es wikipedia org w index php title Prediccion de la estructura de las proteinas amp oldid 142385046, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos