fbpx
Wikipedia

GenBank

GenBank es la base de datos de secuencias genéticas del NIH (National Institutes of Health de Estados Unidos), una colección de disponibilidad pública de secuencias de ADN. Realiza una puesta al día cada dos meses.[2]

GenBank
Tipo Base de datos de secuencias de nucleótidos con información bibliográfica y anotación biológica
Fundación 1982
Sede central Centro Nacional para la Información Biotecnológica (NCBI)
Sitio web www.ncbi.nlm.nih.gov/genbank
[1]

GenBank es parte de International Nucleotide Sequence Database Collaboration, que está integrada por la base de datos de ADN de Japón (DNA DataBank of Japan (DDBJ)), el Laboratorio Europeo de Biología Molecular (European Molecular Biology Laboratory (EMBL)), y GenBank en el National Center for Biotechnology Information (NCBI). Estas organizaciones intercambian datos diariamente. GenBank y sus colaboradores reciben secuencias genéticas producidas en laboratorios de todo el mundo, procedentes de más de 500 000 especies formalmente descritas.[3]​ GenBank continua creciendo a ritmo exponencial, doblando la cantidad de información contenida cada 18 meses.[3][4]​ Según la documentación de la versión 250.0 de GenBank, a fecha de junio de 2022, la base de datos contiene más de 2 450 millones de secuencias, comprendiendo más de 17 billones de bases de nucleótidos.[5]

Las comunicaciones directas con GenBank se hacen utilizando BankIt, que es un formato basado en la Web, o el programa independiente Sequin. Tras la recepción de una secuencia, el personal de GenBank asigna un número de acceso a la secuencia y realiza controles de calidad. Luego, las presentaciones son publicadas en la base de datos pública, en donde las entradas son recuperables por Entrez o se puede descargar por FTP. La mayoría de las presentaciones de Expressed Sequence Tag (EST), Sequence Tagged Site (STB), Genome Survey Sequence (SSG) y High-Throughput Genome Sequence (HTGS) son presentadas por los grandes centros de secuenciación. El grupo de presentaciones directas de GenBank también procesa las secuencias completas del genoma microbiano.

Historia editar

Walter Goad del grupo de Biología teórica y biofísica del Laboratorio Nacional Los Álamos y otros, fundaron la base de datos de secuencias de Los Álamos (LANL) en 1979,[6]​ que culminó en 1982 con la creación de GenBank por parte de los Institutos Nacionales de Salud (National Institutes of Health, NIH), la Fundación Nacional de Ciencia, el Departamento Energía y el de Defensa de EE. UU.. LANL colaboró con GenBank gracias al trabajo de Bolt, Beranek y Newman. Hacia fines de 1983 había más de 2 000 secuencias almacenadas en él.

A mediados de los '80, la compañía de bioinformática Intelligenetics de la Universidad de Stanford manejó el proyecto GenBank en colaboración con LANL. El proyecto GenBank lanzó el grupo de noticias BIOSCI/Bionet que fue uno de los primeros proyectos de la comunidad bioinformática en Internet, y cuyo fin era la promoción de comunicaciones libres entre biocientíficos. Desde 1989 a 1992, el proyecto GenBank tuvo una transición hacia el recién creado Centro Nacional para la Información Biotecnológica (NCBI).

Crecimiento editar

De acuerdo con la versión 250.0 de GenBank (junio 2022), la base de datos almacena más de 239 millones de loci y 1,39 billones de nucleótidos, correspondientes a 239 millones de secuencias de registros tradicionales de GenBank. También incluye conjuntos de datos adicionales y procesados de manera automática a partir de las secuencias tradicionales. Estos proceden de proyectos no finalizados de secuenciación mediante Whole Genome Shotgun (WGS), Transcription Shotgun Assembly (TSA) y Targeted Loci Study (TLS).[5]

Los 20 organismos con el mayor número de pares de bases en la base de datos son:[5]

Organismo Pares de bases
Triticum aestivum  2,15443744183 × 1011
SARS-CoV-2  1,65771825746 × 1011
Hordeum vulgare subsp. vulgare  1,01344340096 × 1011
Mus musculus  3,0614386913 × 1010
Homo sapiens  2,7834633853 × 1010
Avena sativa  2,1127939362 × 1010
Escherichia coli  1,5517830491 × 1010
Klebsiella pneumoniae  1,1144687122 × 1010
Danio rerio  1,0890148966 × 1010
Bos taurus  1,0650671156 × 1010
Triticum turgidum subsp. durum  9,981529154 × 109
Zea mays  7,412263902 × 109
Avena insularis  6,924307246 × 109
Secale cereale  6,749247504 × 109
Rattus norvegicus  6,548854408 × 109
Aegilops longissima  5,920483689 × 109
Canis lupus familiaris  5,776499164 × 109
Aegilops sharonensis  5,272476906 × 109
Sus scrofa  5,179074907 × 109
Rhinatrema bivittatum  5,178626132 × 109

Véase también editar

Referencias editar

  1. Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7 de enero de 2022). «GenBank». Nucleic Acids Archive 50 (D1): D161-D164. doi:10.1093/nar/gkab1135.  Parámetro desconocido |doi-access= ignorado (ayuda)
  2. «GenBank Overview». www.ncbi.nlm.nih.gov. Consultado el 26 de abril de 2021. 
  3. Sayers, Eric W; Cavanaugh, Mark; Clark, Karen; Pruitt, Kim D; Schoch, Conrad L; Sherry, Stephen T; Karsch-Mizrachi, Ilene (7 de enero de 2022). «GenBank». Nucleic Acids Research 50 (D1): D161-D164. ISSN 0305-1048. doi:10.1093/nar/gkab1135. Consultado el 24 de julio de 2022. 
  4. Benson, Dennis A.; Karsch-Mizrachi, Ilene; Lipman, David J.; Ostell, James; Wheeler, David L. (2008-1). «GenBank». Nucleic Acids Research 36 (Database issue): D25-D30. ISSN 0305-1048. PMC 2238942. PMID 18073190. doi:10.1093/nar/gkm929. Consultado el 19 de abril de 2021. 
  5. «Documentación de la versión 250.0 de GenBank» (en inglés). 15 de junio de 2022. Consultado el 24 de julio de 2022. 
  6. Isabel Rey Fraile. Gbif, ed. «¿Qué es Genbank?» (PDF). Consultado el 26 de abril de 2021. 

Bibliografía editar

  • Obituario de Walter Goad, fundador de GenBank el 7 de noviembre de 2008 en Wayback Machine.
  • Benton, D. (1990). «Recent changes in the GenBank On-line Service.». Nucleic Acids Research 18 (6): 1517-1520.  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  • LANL GenBank History
  • Benton, D. et al. (2006). «GenBank». Nucleic Acids Research 34 (Database): D16-D20. 

Enlaces externos editar

  • GenBank
  • Ejemplo de registro de una secuencia de hemoglobina beta
  • BankIt
  • Sequin
  • Emboss
  •   Datos: Q901755
  •   Multimedia: GenBank / Q901755

genbank, base, datos, secuencias, genéticas, national, institutes, health, estados, unidos, colección, disponibilidad, pública, secuencias, realiza, puesta, día, cada, meses, tipobase, datos, secuencias, nucleótidos, información, bibliográfica, anotación, biol. GenBank es la base de datos de secuencias geneticas del NIH National Institutes of Health de Estados Unidos una coleccion de disponibilidad publica de secuencias de ADN Realiza una puesta al dia cada dos meses 2 GenBankTipoBase de datos de secuencias de nucleotidos con informacion bibliografica y anotacion biologicaFundacion1982Sede centralCentro Nacional para la Informacion Biotecnologica NCBI Sitio webwww ncbi nlm nih gov genbank 1 editar datos en Wikidata GenBank es parte de International Nucleotide Sequence Database Collaboration que esta integrada por la base de datos de ADN de Japon DNA DataBank of Japan DDBJ el Laboratorio Europeo de Biologia Molecular European Molecular Biology Laboratory EMBL y GenBank en el National Center for Biotechnology Information NCBI Estas organizaciones intercambian datos diariamente GenBank y sus colaboradores reciben secuencias geneticas producidas en laboratorios de todo el mundo procedentes de mas de 500 000 especies formalmente descritas 3 GenBank continua creciendo a ritmo exponencial doblando la cantidad de informacion contenida cada 18 meses 3 4 Segun la documentacion de la version 250 0 de GenBank a fecha de junio de 2022 la base de datos contiene mas de 2 450 millones de secuencias comprendiendo mas de 17 billones de bases de nucleotidos 5 Las comunicaciones directas con GenBank se hacen utilizando BankIt que es un formato basado en la Web o el programa independiente Sequin Tras la recepcion de una secuencia el personal de GenBank asigna un numero de acceso a la secuencia y realiza controles de calidad Luego las presentaciones son publicadas en la base de datos publica en donde las entradas son recuperables por Entrez o se puede descargar por FTP La mayoria de las presentaciones de Expressed Sequence Tag EST Sequence Tagged Site STB Genome Survey Sequence SSG y High Throughput Genome Sequence HTGS son presentadas por los grandes centros de secuenciacion El grupo de presentaciones directas de GenBank tambien procesa las secuencias completas del genoma microbiano Indice 1 Historia 2 Crecimiento 3 Vease tambien 4 Referencias 5 Bibliografia 6 Enlaces externosHistoria editarWalter Goad del grupo de Biologia teorica y biofisica del Laboratorio Nacional Los Alamos y otros fundaron la base de datos de secuencias de Los Alamos LANL en 1979 6 que culmino en 1982 con la creacion de GenBank por parte de los Institutos Nacionales de Salud National Institutes of Health NIH la Fundacion Nacional de Ciencia el Departamento Energia y el de Defensa de EE UU LANL colaboro con GenBank gracias al trabajo de Bolt Beranek y Newman Hacia fines de 1983 habia mas de 2 000 secuencias almacenadas en el A mediados de los 80 la compania de bioinformatica Intelligenetics de la Universidad de Stanford manejo el proyecto GenBank en colaboracion con LANL El proyecto GenBank lanzo el grupo de noticias BIOSCI Bionet que fue uno de los primeros proyectos de la comunidad bioinformatica en Internet y cuyo fin era la promocion de comunicaciones libres entre biocientificos Desde 1989 a 1992 el proyecto GenBank tuvo una transicion hacia el recien creado Centro Nacional para la Informacion Biotecnologica NCBI Crecimiento editarDe acuerdo con la version 250 0 de GenBank junio 2022 la base de datos almacena mas de 239 millones de loci y 1 39 billones de nucleotidos correspondientes a 239 millones de secuencias de registros tradicionales de GenBank Tambien incluye conjuntos de datos adicionales y procesados de manera automatica a partir de las secuencias tradicionales Estos proceden de proyectos no finalizados de secuenciacion mediante Whole Genome Shotgun WGS Transcription Shotgun Assembly TSA y Targeted Loci Study TLS 5 Los 20 organismos con el mayor numero de pares de bases en la base de datos son 5 Organismo Pares de basesTriticum aestivum 2 15443744183 1011SARS CoV 2 1 65771825746 1011Hordeum vulgare subsp vulgare 1 01344340096 1011Mus musculus 3 0614386913 1010Homo sapiens 2 7834633853 1010Avena sativa 2 1127939362 1010Escherichia coli 1 5517830491 1010Klebsiella pneumoniae 1 1144687122 1010Danio rerio 1 0890148966 1010Bos taurus 1 0650671156 1010Triticum turgidum subsp durum 9 981529154 109Zea mays 7 412263902 109Avena insularis 6 924307246 109Secale cereale 6 749247504 109Rattus norvegicus 6 548854408 109Aegilops longissima 5 920483689 109Canis lupus familiaris 5 776499164 109Aegilops sharonensis 5 272476906 109Sus scrofa 5 179074907 109Rhinatrema bivittatum 5 178626132 109Vease tambien editarEnsembl HPRD UniProt BioinformaticaReferencias editar Eric W Sayers Mark Cavanaugh Karen Clark Kim D Pruitt Conrad L Schoch Stephen T Sherry Ilene Karsch Mizrachi 7 de enero de 2022 GenBank Nucleic Acids Archive 50 D1 D161 D164 doi 10 1093 nar gkab1135 Parametro desconocido doi access ignorado ayuda GenBank Overview www ncbi nlm nih gov Consultado el 26 de abril de 2021 a b Sayers Eric W Cavanaugh Mark Clark Karen Pruitt Kim D Schoch Conrad L Sherry Stephen T Karsch Mizrachi Ilene 7 de enero de 2022 GenBank Nucleic Acids Research 50 D1 D161 D164 ISSN 0305 1048 doi 10 1093 nar gkab1135 Consultado el 24 de julio de 2022 Benson Dennis A Karsch Mizrachi Ilene Lipman David J Ostell James Wheeler David L 2008 1 GenBank Nucleic Acids Research 36 Database issue D25 D30 ISSN 0305 1048 PMC 2238942 PMID 18073190 doi 10 1093 nar gkm929 Consultado el 19 de abril de 2021 a b c Documentacion de la version 250 0 de GenBank en ingles 15 de junio de 2022 Consultado el 24 de julio de 2022 Isabel Rey Fraile Gbif ed Que es Genbank PDF Consultado el 26 de abril de 2021 Bibliografia editarObituario de Walter Goad fundador de GenBank Archivado el 7 de noviembre de 2008 en Wayback Machine Benton D 1990 Recent changes in the GenBank On line Service Nucleic Acids Research 18 6 1517 1520 enlace roto disponible en Internet Archive vease el historial la primera version y la ultima LANL GenBank History Benton D et al 2006 GenBank Nucleic Acids Research 34 Database D16 D20 Enlaces externos editarGenBank Ejemplo de registro de una secuencia de hemoglobina beta BankIt Sequin Emboss GenBank RefSeq TPA and UniProt What s in a Name nbsp Datos Q901755 nbsp Multimedia GenBank Q901755 Obtenido de https es wikipedia org w index php title GenBank amp oldid 157751868, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos