fbpx
Wikipedia

Base de datos biológica

Una base de datos biológica es una colección de información sobre ciencias de la vida, recogida de experimentos científicos, literatura publicada, tecnología de experimentación de alto rendimiento, y análisis computacional.[1]​ Contiene información de áreas de investigación incluyendo genómica, proteómica, metabolómica, expresión génica mediante microarrays, y filogenética.[2]​ La información contenida en bases de datos biológicas incluye funciones, estructura y localización (tanto celular como cromosómica) de genes y efectos clínicos de mutaciones, así como similitudes de secuencias y estructuras biológicas.

En los últimos años, debido a la rápida evolución de las técnicas experimentales de alto rendimiento (Secuenciación del ADN, Cristalografía de rayos X, Microarreglo de ADN) se generó un crecimiento exponencial en la cantidad de datos biológicos (secuencias genómicas y de proteínas, estructuras de proteínas, expresión génica, mutaciones, etc) que generaron la necesidad de contar con formas eficientes de almacenar la información.

Descripción

Las bases de datos biológicas constituyen una herramienta esencial para almacenar, estructurar, organizar, actualizar y manipular datos biológicos. La variedad de éstos datos, así como también su rápido crecimiento, hacen a las bases de datos una herramienta clave. Se han convertido en un instrumento indispensable para los científicos experimentales del campo de la biología, como para aquellos científicos del área de la bioinformática que desarrollan experimentos in silico.

Las bases de datos biológicas surgen a partir de los conceptos de bases de datos relacionales de las ciencias de la computación, y los conceptos de recuperación de información de las bibliotecas digitales. El diseño de estas bases de datos, su desarrollo y su gestión a largo plazo, forman un área nuclear dentro de la bioinformática.[3]​ El contenido de los datos incluye secuencias génicas, descripciones textuales, atributos y clasificaciones ontológicas, estructuras de proteínas, anotaciones, entre otras. Estos son descritos a menudo como datos semi-estructurados, y se pueden representar como tablas, registros delimitados por claves y estructuras XML. Son comunes las referencias cruzadas entre las diferentes bases de datos biológicas usando los números de acceso (identificadores únicos de los registros en una base de datos, o también conocidos como Clave primaria).

Las bases de datos para ayudan a los científicos a comprender y explicar una serie de fenómenos biológicos desde la estructura biomolecular de una proteína y su interacción, hasta el metabolismo completo de los organismos y a la comprensión de la evolución de las especies.

Un recurso importante para la búsqueda de bases de datos biológicos es la edición anual de la revista Nucleic Acids Research (NAR). Una edición de bases de datos en NAR está disponible gratuitamente todos los años, donde se publican nuevas base de datos y algunas actualizaciones de las ya conocidas. Se encuentran clasificadas de acuerdo a su temática y están en línea a disposición de toda la comunidad científica.

Clasificación de bases de datos biológicas

Las bases de datos biológicas se han desarrollado para diversos propósitos, almacenan varios tipos de datos heterogéneos y son curadas a distintos niveles con diferentes métodos, por lo tanto hay diferentes criterios para su clasificación.[4][5]

Alcance y cobertura de los datos

Según este criterio, las bases de datos pueden clasificarse en exhaustivas o especializadas:

  • Exhaustivas: abarcan diferentes tipos de datos de muchas especies. Ejemplos típicos son GenBank la base de datos moleculares mantenidos por el European Bioinformatics Institute European Molecular Biology Laboratory (EMBL-EBI) y DNA Data Bank of Japan (DDJB). Estas tres bases de datos fueron establecidas como una Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos en 1988, para colectar y compartir secuencias de ADN y ARN
  • Especializadas: contienen información específica o de especies particulares. Por ejemplo WormBase que contiene información biológica y genómica de nemátodos.

Según la fuente de los datos

De acuerdo a este criterio, las bases de datos pueden clasificarse como primarias, secundarias y combinadas:

  • Primarias: Contienen información solamente de la secuencia o la estructura, es decir que los datos experimentales son directamente subidos a la base de datos. En esta categoría encontramos las bases de datos GenBank, DNA Data Bank of Japan (DDJB)], UniProtKB/TrEMBL y Protein Data Bank (PDB)
  • Secundarias: Contienen información derivada de las bases de datos primarias. Una base de datos secundaria de secuencia contiene información de la conservación de la secuencia, patrones de secuencia y residuos del sitio activo de familias de proteínas derivados de alineamientos múltiples entre secuencias evolutivamente relacionadas. Una base de datos secundaria de estructuras organiza las entradas de PDB clasificándolas, por ejemplo, de acuerdo a su estructura como todas alfa, todas beta, alfa-beta, etc. Algunos ejemplos de éstas bases de datos son: CATH y SCOP
  • Compuestas: combinan una variedad de fuentes primarias de datos, como por ejemplo, el National Center for Biotechnology Information (NCBI) que alberga un conjunto de bases de datos de secuencia, taxonomía, genomas, mutaciones, entre otras y además herramientas como BLAST para búsquedas por similitud de secuencia.

Nivel de curación

De acuerdo al nivel de curación, pueden clasificarse en bases de datos primarias, secundarias o derivadas:

  • Primarias: contienen datos “crudos” a modo de repositorio de archivos como [[NCBI Sequence Read Archive] (SRA)'
  • Secundarias o derivadas: almacena información que tiene un valor agregado por ser curada, por ejemplo NCBI RefSeq

Método de conservación

El crecimiento explosivo de la cantidad de datos disponibles requiere de curación, integración y anotación, que se logra mediante la colaboración colectiva. Desde este punto de vista, las bases de datos biológicas pueden clasificarse como:

  • Conservadas por expertos, por ejemplo RefSeq y [The Arabidopsis Information Resource]] (TAIR)
  • Conservadas por una comunidad de investigadores, de forma colectiva y colaborativa, por ejemplo LncRNA Wiki y GeneWiki

Tipo de datos almacenados

De acuerdo al tipo de datos almacenados en cada base de datos, las bases de datos biológicas pueden clasificarse de forma genérica en alguna de las siguientes categorías (se listan algunos ejemplos de bases de datos):

  • Secuencias nucleotídicas (ADN y ARN): la colaboración de las tres bases de datos más importantes hace posible acceder a casi toda la información de secuencias de nucleótidos desde cualquiera de sus tres sedes

Bases de datos de EMBL en el European Bioinformatics Institute (EMBL-EBI). Enlace externo base de datos de nucleótidos de EMBL-EBI

DNA Data Bank of Japan (DDJB). Enlace externo DDJB

GenBank en el National Center for Biological Information (NCBI). Enlace externo GenBank

Si bien son mantenidas por distintos organismos en distintos países, existe una coordinación entre las distintas bases. Una secuencia enviada a cualquiera de las bases se verá reflejada en las otras dos en aproximadamente una semana, ya que esa es la frecuencia de actualización entre las distintas bases genéticas. Por este motivo es indistinto que base se use para enviar nuevas secuencias, aunque normalmente los europeos utilizan EMBL y los americanos GenBank.

  • Proteínas: bases de datos de secuencias, estructuras, e información relacionada

UniProtKB/Swiss-Prot contiene secuencias anotadas o comentadas, es decir, cada secuencia ha sido revisada, documentada y enlazada a otras bases de datos. Enlaces externos UniProtKB, Swissprot en el EBI UniProtKB/TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes derivadas del (EMBL) y que todavía no han podido ser anotadas en Swiss-Prot. Enlaces externos TrEMBL, UniProtKB 'PIR por Protein Information Resource está dividida en cuatro sub-bases que tienen un nivel de anotación decreciente. Enlace externo

'ENZYME enlaza la clasificación de actividades enzimáticas completa a las secuencias de Swiss-Prot. Enlace externo ENZYME

'PROSITE contiene información sobre la estructura secundaria de proteínas, familias, dominios, etc. Enlace externo PROSITE

'InterPro integra la información de diversas bases de datos de estructura secundaria como PROSITE, proporcionando enlaces a otras bases de datos e información más extensa. Enlace externo INTERPRO

'Protein Data Bank (PDB) es la base de datos de estructura terciaria 3D de proteínas que han sido cristalizadas. Enlace externo

El portal de EMBL-EBI ofrece una variedad de bases de datos de expresión génica. Enlace externo a bases de datos de expresión de EMBL-EBI

Reactome es una base de datos curada y revisada de EMBL-EBI de rutas de interacción y reacción de proteínas y enzimas. Enlace externo a Reactome

APID[6]​ es una base de datos de interacciones proteína-proteína que incluye interactomas completos para múltiples especies. Enlace externo a APID

  • Variación genética (SNPs) y enfermedad

dbSNP de NCBI, ofrece un repositorio central de variaciones genéticas que comprenden sustituciones simples de nucleótidos y polimorfismos de inserciones y deleciones cortas. Enlace a dbSNP

COSMIC es un catálogo de mutaciones somáticas en cáncer, mantenida por el Wellcome Trust Sanger Institute. Enlace externo a COSMIC

'OMIM por Online Mendelian Inheritance in Man es un catálogo de genes humanos relacionados con desórdenes genéticos. Enlace externo OMIM

  • Literatura

Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca Nacional de Medicina (NLM), con enlaces a artículos completos. Enlace externo PubMed

  • Ontología

El proyecto de Ontología Génica (GO) es un esfuerzo colaborativo que surgió de la necesidad de tener descriptores consistentes de los productos de genes depositados en distintas bases de datos. Enlace externo a Gene Ontology Consortium

Ensembl integra genomas eucariotas grandes, por el momento contiene genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae. Enlace externo

Genomes server y TIGR son portales con información o enlaces de todos los genomas secuenciados por el momento, desde virus a humanos. Enlace externo Genome Server, enlace externo TIGR

Wormbase es el portal del genoma de gusano C. elegans. Enlace externo

Flybase es el portal de la mosca de la fruta Drosophila melanogaster. Enlace externo

  • Otras

Taxonomy es el portal de clasificación taxonómica de organismos. Enlace externo Taxonomy Browser

Xenobase es el portal del organismo modelo Xenopus laevis. Enlace externo: Xenbase

TAIR (The Arabidopsis Information Resource) es el portal de la planta modelo Arabidopsis thaliana. Enlace externo Arabidopsis

GYPSY, base de datos de elementos genéticos móviles. Enlace externo The GYPSY Database of Mobile Genetic Elements

Problemas por los formatos de entrada

Un problema fundamental en todas las grandes bases de datos genómicas es que los registros provienen de una gran variedad de fuentes, desde investigadores individuales hasta grandes centros de secuenciación. Como resultado, las secuencias mismas y principalmente las anotaciones biológicas adjuntas a estas secuencias, varían notablemente en calidad. También hay mucha redundancia ya que muchos laboratorios ingresan a menudo secuencias que son idénticas o muy similares a otras en la base de datos.

Muchas anotaciones no están basadas en experimentos de laboratorio sino en resultados de búsquedas de secuencias similares de secuencias previamente anotadas. Por supuesto, una vez que una secuencia es anotada basándose en su similitud con otra, puede servir como base para futuras anotaciones. Esto conduce al problema de las anotaciones transitivas, porque puede haber varias de esas secuencias transferidas por similitud de secuencia entre una base de datos de registro real y la información experimental de laboratorio. Por lo tanto, siempre hay observar el sentido biológico de las anotaciones en las principales bases de datos de secuencias con un considerable grado de escepticismo, a menos que pueda ser verificada por referencias a artículos publicados con la descripción de la alta calidad de los datos experimentales, o al menos por referencia a una secuencia de la base de datos arreglada por un humano.

Véase también

Referencias

  1. Attwood T.K., Gisel A., Eriksson N-E. and Bongcam-Rudloff E. (2011). «Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective». Bioinformatics - Trends and Methodologies. InTech. Consultado el 8 de enero de 2012. 
  2. Altman RB (marzo de 2004). «Building successful biological databases». Brief. Bioinformatics 5 (1): 4-5. PMID 15153301. 
  3. Bourne P (agosto de 2005). «Will a biological database be different from a biological journal?». PLoS Comput. Biol. 1 (3): 179-81. PMID 16158097. doi:10.1371/journal.pcbi.0010034. 
  4. Zou, Dong; Ma, Lina; Yu, Jun; Zhang, Zhang (1 de febrero de 2015). «Biological databases for human research». Genomics, Proteomics & Bioinformatics 13 (1): 55-63. ISSN 2210-3244. PMC 4411498. PMID 25712261. doi:10.1016/j.gpb.2015.01.006. Consultado el 4 de diciembre de 2015. 
  5. [1]
  6. Alonso-López, Diego; Gutiérrez, Miguel A.; Lopes, Katia P.; Prieto, Carlos; Santamaría, Rodrigo; De Las Rivas, Javier (30 de abril de 2016). «APID interactomes: providing proteome-based interactomes with controlled quality for multiple species and derived networks». Nucleic Acids Research (en inglés): gkw363. ISSN 0305-1048. PMID 27131791. doi:10.1093/nar/gkw363. Consultado el 25 de mayo de 2016. 

Enlaces externos

  • Genome Proteome Search Engine para buscar a través de las bases de datos biológicas
  • Cyberinfrastructure for Metagenomics, repositorio libre de datos y herramientas bioinformáticas para metagenómica
  • European Bioinformatics Institute databases
  • genomas completamente secuenciados en NCBI
  • Base de datos de Standford con el genoma de Saccharomyces
  •   Datos: Q4117139
  •   Multimedia: Bioinformatics databases

base, datos, biológica, base, datos, biológica, colección, información, sobre, ciencias, vida, recogida, experimentos, científicos, literatura, publicada, tecnología, experimentación, alto, rendimiento, análisis, computacional, contiene, información, áreas, in. Una base de datos biologica es una coleccion de informacion sobre ciencias de la vida recogida de experimentos cientificos literatura publicada tecnologia de experimentacion de alto rendimiento y analisis computacional 1 Contiene informacion de areas de investigacion incluyendo genomica proteomica metabolomica expresion genica mediante microarrays y filogenetica 2 La informacion contenida en bases de datos biologicas incluye funciones estructura y localizacion tanto celular como cromosomica de genes y efectos clinicos de mutaciones asi como similitudes de secuencias y estructuras biologicas En los ultimos anos debido a la rapida evolucion de las tecnicas experimentales de alto rendimiento Secuenciacion del ADN Cristalografia de rayos X Microarreglo de ADN se genero un crecimiento exponencial en la cantidad de datos biologicos secuencias genomicas y de proteinas estructuras de proteinas expresion genica mutaciones etc que generaron la necesidad de contar con formas eficientes de almacenar la informacion Indice 1 Descripcion 2 Clasificacion de bases de datos biologicas 2 1 Alcance y cobertura de los datos 2 2 Segun la fuente de los datos 2 3 Nivel de curacion 2 4 Metodo de conservacion 2 5 Tipo de datos almacenados 3 Problemas por los formatos de entrada 4 Vease tambien 5 Referencias 6 Enlaces externosDescripcion EditarLas bases de datos biologicas constituyen una herramienta esencial para almacenar estructurar organizar actualizar y manipular datos biologicos La variedad de estos datos asi como tambien su rapido crecimiento hacen a las bases de datos una herramienta clave Se han convertido en un instrumento indispensable para los cientificos experimentales del campo de la biologia como para aquellos cientificos del area de la bioinformatica que desarrollan experimentos in silico Las bases de datos biologicas surgen a partir de los conceptos de bases de datos relacionales de las ciencias de la computacion y los conceptos de recuperacion de informacion de las bibliotecas digitales El diseno de estas bases de datos su desarrollo y su gestion a largo plazo forman un area nuclear dentro de la bioinformatica 3 El contenido de los datos incluye secuencias genicas descripciones textuales atributos y clasificaciones ontologicas estructuras de proteinas anotaciones entre otras Estos son descritos a menudo como datos semi estructurados y se pueden representar como tablas registros delimitados por claves y estructuras XML Son comunes las referencias cruzadas entre las diferentes bases de datos biologicas usando los numeros de acceso identificadores unicos de los registros en una base de datos o tambien conocidos como Clave primaria Las bases de datos para ayudan a los cientificos a comprender y explicar una serie de fenomenos biologicos desde la estructura biomolecular de una proteina y su interaccion hasta el metabolismo completo de los organismos y a la comprension de la evolucion de las especies Un recurso importante para la busqueda de bases de datos biologicos es la edicion anual de la revista Nucleic Acids Research NAR Una edicion de bases de datos en NAR esta disponible gratuitamente todos los anos donde se publican nuevas base de datos y algunas actualizaciones de las ya conocidas Se encuentran clasificadas de acuerdo a su tematica y estan en linea a disposicion de toda la comunidad cientifica Clasificacion de bases de datos biologicas EditarLas bases de datos biologicas se han desarrollado para diversos propositos almacenan varios tipos de datos heterogeneos y son curadas a distintos niveles con diferentes metodos por lo tanto hay diferentes criterios para su clasificacion 4 5 Alcance y cobertura de los datos Editar Segun este criterio las bases de datos pueden clasificarse en exhaustivas o especializadas Exhaustivas abarcan diferentes tipos de datos de muchas especies Ejemplos tipicos son GenBank la base de datos moleculares mantenidos por el European Bioinformatics Institute European Molecular Biology Laboratory EMBL EBI y DNA Data Bank of Japan DDJB Estas tres bases de datos fueron establecidas como una Colaboracion Internacional de Bases de Datos de Secuencias de Nucleotidos en 1988 para colectar y compartir secuencias de ADN y ARN Especializadas contienen informacion especifica o de especies particulares Por ejemplo WormBase que contiene informacion biologica y genomica de nematodos Segun la fuente de los datos Editar De acuerdo a este criterio las bases de datos pueden clasificarse como primarias secundarias y combinadas Primarias Contienen informacion solamente de la secuencia o la estructura es decir que los datos experimentales son directamente subidos a la base de datos En esta categoria encontramos las bases de datos GenBank DNA Data Bank of Japan DDJB UniProtKB TrEMBL y Protein Data Bank PDB Secundarias Contienen informacion derivada de las bases de datos primarias Una base de datos secundaria de secuencia contiene informacion de la conservacion de la secuencia patrones de secuencia y residuos del sitio activo de familias de proteinas derivados de alineamientos multiples entre secuencias evolutivamente relacionadas Una base de datos secundaria de estructuras organiza las entradas de PDB clasificandolas por ejemplo de acuerdo a su estructura como todas alfa todas beta alfa beta etc Algunos ejemplos de estas bases de datos son CATH y SCOP Compuestas combinan una variedad de fuentes primarias de datos como por ejemplo el National Center for Biotechnology Information NCBI que alberga un conjunto de bases de datos de secuencia taxonomia genomas mutaciones entre otras y ademas herramientas como BLAST para busquedas por similitud de secuencia Nivel de curacion Editar De acuerdo al nivel de curacion pueden clasificarse en bases de datos primarias secundarias o derivadas Primarias contienen datos crudos a modo de repositorio de archivos como NCBI Sequence Read Archive SRA Secundarias o derivadas almacena informacion que tiene un valor agregado por ser curada por ejemplo NCBI RefSeqMetodo de conservacion Editar El crecimiento explosivo de la cantidad de datos disponibles requiere de curacion integracion y anotacion que se logra mediante la colaboracion colectiva Desde este punto de vista las bases de datos biologicas pueden clasificarse como Conservadas por expertos por ejemplo RefSeq y The Arabidopsis Information Resource TAIR Conservadas por una comunidad de investigadores de forma colectiva y colaborativa por ejemplo LncRNA Wiki y GeneWikiTipo de datos almacenados Editar De acuerdo al tipo de datos almacenados en cada base de datos las bases de datos biologicas pueden clasificarse de forma generica en alguna de las siguientes categorias se listan algunos ejemplos de bases de datos Secuencias nucleotidicas ADN y ARN la colaboracion de las tres bases de datos mas importantes hace posible acceder a casi toda la informacion de secuencias de nucleotidos desde cualquiera de sus tres sedesBases de datos de EMBL en el European Bioinformatics Institute EMBL EBI Enlace externo base de datos de nucleotidos de EMBL EBIDNA Data Bank of Japan DDJB Enlace externo DDJBGenBank en el National Center for Biological Information NCBI Enlace externo GenBankSi bien son mantenidas por distintos organismos en distintos paises existe una coordinacion entre las distintas bases Una secuencia enviada a cualquiera de las bases se vera reflejada en las otras dos en aproximadamente una semana ya que esa es la frecuencia de actualizacion entre las distintas bases geneticas Por este motivo es indistinto que base se use para enviar nuevas secuencias aunque normalmente los europeos utilizan EMBL y los americanos GenBank Proteinas bases de datos de secuencias estructuras e informacion relacionadaUniProtKB Swiss Prot contiene secuencias anotadas o comentadas es decir cada secuencia ha sido revisada documentada y enlazada a otras bases de datos Enlaces externos UniProtKB Swissprot en el EBI UniProtKB TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traduccion de todas las secuencias codificantes derivadas del EMBL y que todavia no han podido ser anotadas en Swiss Prot Enlaces externos TrEMBL UniProtKB PIR por Protein Information Resource esta dividida en cuatro sub bases que tienen un nivel de anotacion decreciente Enlace externo PIR ENZYME enlaza la clasificacion de actividades enzimaticas completa a las secuencias de Swiss Prot Enlace externo ENZYME PROSITE contiene informacion sobre la estructura secundaria de proteinas familias dominios etc Enlace externo PROSITE InterPro integra la informacion de diversas bases de datos de estructura secundaria como PROSITE proporcionando enlaces a otras bases de datos e informacion mas extensa Enlace externo INTERPRO Protein Data Bank PDB es la base de datos de estructura terciaria 3D de proteinas que han sido cristalizadas Enlace externo PDB ExpresionEl portal de EMBL EBI ofrece una variedad de bases de datos de expresion genica Enlace externo a bases de datos de expresion de EMBL EBI Interactomas reactomas y rutas metabolicasReactome es una base de datos curada y revisada de EMBL EBI de rutas de interaccion y reaccion de proteinas y enzimas Enlace externo a ReactomeAPID 6 es una base de datos de interacciones proteina proteina que incluye interactomas completos para multiples especies Enlace externo a APID Variacion genetica SNPs y enfermedaddbSNP de NCBI ofrece un repositorio central de variaciones geneticas que comprenden sustituciones simples de nucleotidos y polimorfismos de inserciones y deleciones cortas Enlace a dbSNPCOSMIC es un catalogo de mutaciones somaticas en cancer mantenida por el Wellcome Trust Sanger Institute Enlace externo a COSMIC OMIM por Online Mendelian Inheritance in Man es un catalogo de genes humanos relacionados con desordenes geneticos Enlace externo OMIM LiteraturaPubmed da acceso gratuito al indice de publicaciones de la Biblioteca Nacional de Medicina NLM con enlaces a articulos completos Enlace externo PubMed OntologiaEl proyecto de Ontologia Genica GO es un esfuerzo colaborativo que surgio de la necesidad de tener descriptores consistentes de los productos de genes depositados en distintas bases de datos Enlace externo a Gene Ontology Consortium genomasEnsembl integra genomas eucariotas grandes por el momento contiene genoma humano raton rata fugu zebrafish mosquito Drosophila C elegans y C briggsae Enlace externo EnsemblGenomes server y TIGR son portales con informacion o enlaces de todos los genomas secuenciados por el momento desde virus a humanos Enlace externo Genome Server enlace externo TIGRWormbase es el portal del genoma de gusano C elegans Enlace externo WormbaseFlybase es el portal de la mosca de la fruta Drosophila melanogaster Enlace externo Flybase OtrasTaxonomy es el portal de clasificacion taxonomica de organismos Enlace externo Taxonomy BrowserXenobase es el portal del organismo modelo Xenopus laevis Enlace externo XenbaseTAIR The Arabidopsis Information Resource es el portal de la planta modelo Arabidopsis thaliana Enlace externo ArabidopsisGYPSY base de datos de elementos geneticos moviles Enlace externo The GYPSY Database of Mobile Genetic ElementsProblemas por los formatos de entrada EditarUn problema fundamental en todas las grandes bases de datos genomicas es que los registros provienen de una gran variedad de fuentes desde investigadores individuales hasta grandes centros de secuenciacion Como resultado las secuencias mismas y principalmente las anotaciones biologicas adjuntas a estas secuencias varian notablemente en calidad Tambien hay mucha redundancia ya que muchos laboratorios ingresan a menudo secuencias que son identicas o muy similares a otras en la base de datos Muchas anotaciones no estan basadas en experimentos de laboratorio sino en resultados de busquedas de secuencias similares de secuencias previamente anotadas Por supuesto una vez que una secuencia es anotada basandose en su similitud con otra puede servir como base para futuras anotaciones Esto conduce al problema de las anotaciones transitivas porque puede haber varias de esas secuencias transferidas por similitud de secuencia entre una base de datos de registro real y la informacion experimental de laboratorio Por lo tanto siempre hay observar el sentido biologico de las anotaciones en las principales bases de datos de secuencias con un considerable grado de escepticismo a menos que pueda ser verificada por referencias a articulos publicados con la descripcion de la alta calidad de los datos experimentales o al menos por referencia a una secuencia de la base de datos arreglada por un humano Vease tambien EditarBioinformatica Base de datos NCBI PubMedReferencias Editar Attwood T K Gisel A Eriksson N E and Bongcam Rudloff E 2011 Concepts Historical Milestones and the Central Place of Bioinformatics in Modern Biology A European Perspective Bioinformatics Trends and Methodologies InTech Consultado el 8 de enero de 2012 Altman RB marzo de 2004 Building successful biological databases Brief Bioinformatics 5 1 4 5 PMID 15153301 Bourne P agosto de 2005 Will a biological database be different from a biological journal PLoS Comput Biol 1 3 179 81 PMID 16158097 doi 10 1371 journal pcbi 0010034 Zou Dong Ma Lina Yu Jun Zhang Zhang 1 de febrero de 2015 Biological databases for human research Genomics Proteomics amp Bioinformatics 13 1 55 63 ISSN 2210 3244 PMC 4411498 PMID 25712261 doi 10 1016 j gpb 2015 01 006 Consultado el 4 de diciembre de 2015 1 Alonso Lopez Diego Gutierrez Miguel A Lopes Katia P Prieto Carlos Santamaria Rodrigo De Las Rivas Javier 30 de abril de 2016 APID interactomes providing proteome based interactomes with controlled quality for multiple species and derived networks Nucleic Acids Research en ingles gkw363 ISSN 0305 1048 PMID 27131791 doi 10 1093 nar gkw363 Consultado el 25 de mayo de 2016 Enlaces externos EditarGenome Proteome Search Engine para buscar a traves de las bases de datos biologicas DBD Database of Biological Databases Bioinformatics Databases CAMERA Cyberinfrastructure for Metagenomics repositorio libre de datos y herramientas bioinformaticas para metagenomica European Bioinformatics Institute databases genomas completamente secuenciados en NCBI Base de datos de Standford con el genoma de Saccharomyces Datos Q4117139 Multimedia Bioinformatics databasesObtenido de https es wikipedia org w index php title Base de datos biologica amp oldid 136523836, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos