fbpx
Wikipedia

Montaje de secuencias

En bioinformática, el montaje o ensamblaje de secuencias se refiere al alineamiento y mezcla de múltiples fragmentos de una secuencia de ADN mucho mayor para reconstruir la secuencia original. Normalmente los fragmentos cortos provienen de secuenciación "por perdigonada" (shotgun) de ADN genómico, o de transcripción genética (ESTs, o marcadores de secuencia expresada).

La primera generación de montadores de secuencias empezaron a aparecer en los últimos 80 y primeros 90 del siglo XX, para reconstruir las grandes cantidades de fragmentos generadas por instrumentos de secuenciación automática. Estos ensambladores de primera generación utilizaban varias estrategias para manejar las secuencias repetitivas y los errores de secuenciación, que podían confundir el ensamblado. Sin embargo, no podían manejar genomas mucho más largos que los de una bacteria (varios millones de bases de ADN), y fueron siendo reemplazados conforme el campo se movía hacia genomas mayores. Los que se relacionan a continuación fueron montadores de primera generación ampliamente usados en los 90 en universidades, instituciones gubernamentales y en la industria:

  • Phrap, por Phil Green, de la University de Washington.
  • TIGR Assembler, por Granger Sutton, The Institute for Genomic Research.
  • CAP3, por Xiaoqiu Huang, del Michigan Technological University.

Ensambladores modernos, como DNA Baser,[1]​ han traído importantes mejoras sobre los de primera generación reduciendo el tiempo necesario para crear un contig desde decenas de minutos a segundos, usando algoritmos de ensamblado inteligente, ensamblado por lotes, y detección automática de calidad y zonas terminales de corte.

Montadores para genomas largos

Enfrentados al desafío de ensamblar el mucho más largo genoma de la mosca de la fruta Drosophila melanogaster en el año 2000, así como el genoma humano solo un año después, los científicos desarrollaron montadores como el Celera Assembler (el primero desarrollado por una compañía privada) y Arachne, capaces de manejar genomas de 100-300 millones de pares de bases. Con posterioridad a estos esfuerzos, otros grupos, principalmente de los mayores centros de secuenciación, construyeron ensambladores a gran escala, y un esfuerzo de código abierto conocido como AMOS se lanzó para aglutinar todas las innovaciones en la tecnología de ensamblado de genomas bajo el marco de código abierto.

En ensamblado de ESTs difiere del ensamblado de genomas en varias características. Por ejemplo, los genomas tienen, a menudo, grandes cantidades de secuencias repetitivas, principalmente en las partes intergénicas. Puesto que las ESTs representan transcripciones génicas, no contienen estas repeticiones. Por otra parte, los genes se solapan a veces en el genoma (transcripción sentido-antisentido), y podrían ser todavía ensamblados idealmente de forma separada. El montaje de ESTs también es complicado por características tales como (cis-)splicing alternativo, trans-splicing, polimorfismos de nucleótido simple, recodificación, y modificaciones post-transcripcionales. Estas diferencias hacen a las nuevas generaciones de ensambladores menos aplicables al ensamblaje de ESTs.

Algoritmo voraz para el montado de secuencias

Dado un conjunto de fragmentos de secuencia, el objetivo es encontrar la supersecuencia común (o secuencia origen de los fragmentos) más corta:

  1. Calcular alineamientos por pares de todos los fragmentos.
  2. Elegir los dos fragmentos con el mayor solapamiento.
  3. Mezclar los fragmentos elegidos.
  4. Repetir los pasos 2. y 3. hasta que solo quede un fragmento.

El resultado es una solución subóptima al problema.

Referencias

  1. DNA Baser-automatic sequence assembly
  • Ensamblador automático de secuencias DNA Baser.
  • Phrap
  • CAP3
  • AMOS

Véase también

  •   Datos: Q740578

montaje, secuencias, para, otros, usos, este, término, véase, montaje, desambiguación, bioinformática, montaje, ensamblaje, secuencias, refiere, alineamiento, mezcla, múltiples, fragmentos, secuencia, mucho, mayor, para, reconstruir, secuencia, original, norma. Para otros usos de este termino vease Montaje desambiguacion En bioinformatica el montaje o ensamblaje de secuencias se refiere al alineamiento y mezcla de multiples fragmentos de una secuencia de ADN mucho mayor para reconstruir la secuencia original Normalmente los fragmentos cortos provienen de secuenciacion por perdigonada shotgun de ADN genomico o de transcripcion genetica ESTs o marcadores de secuencia expresada La primera generacion de montadores de secuencias empezaron a aparecer en los ultimos 80 y primeros 90 del siglo XX para reconstruir las grandes cantidades de fragmentos generadas por instrumentos de secuenciacion automatica Estos ensambladores de primera generacion utilizaban varias estrategias para manejar las secuencias repetitivas y los errores de secuenciacion que podian confundir el ensamblado Sin embargo no podian manejar genomas mucho mas largos que los de una bacteria varios millones de bases de ADN y fueron siendo reemplazados conforme el campo se movia hacia genomas mayores Los que se relacionan a continuacion fueron montadores de primera generacion ampliamente usados en los 90 en universidades instituciones gubernamentales y en la industria Phrap por Phil Green de la University de Washington TIGR Assembler por Granger Sutton The Institute for Genomic Research CAP3 por Xiaoqiu Huang del Michigan Technological University Ensambladores modernos como DNA Baser 1 han traido importantes mejoras sobre los de primera generacion reduciendo el tiempo necesario para crear un contig desde decenas de minutos a segundos usando algoritmos de ensamblado inteligente ensamblado por lotes y deteccion automatica de calidad y zonas terminales de corte Indice 1 Montadores para genomas largos 2 Algoritmo voraz para el montado de secuencias 3 Referencias 4 Vease tambienMontadores para genomas largos EditarEnfrentados al desafio de ensamblar el mucho mas largo genoma de la mosca de la fruta Drosophila melanogaster en el ano 2000 asi como el genoma humano solo un ano despues los cientificos desarrollaron montadores como el Celera Assembler el primero desarrollado por una compania privada y Arachne capaces de manejar genomas de 100 300 millones de pares de bases Con posterioridad a estos esfuerzos otros grupos principalmente de los mayores centros de secuenciacion construyeron ensambladores a gran escala y un esfuerzo de codigo abierto conocido como AMOS se lanzo para aglutinar todas las innovaciones en la tecnologia de ensamblado de genomas bajo el marco de codigo abierto En ensamblado de ESTs difiere del ensamblado de genomas en varias caracteristicas Por ejemplo los genomas tienen a menudo grandes cantidades de secuencias repetitivas principalmente en las partes intergenicas Puesto que las ESTs representan transcripciones genicas no contienen estas repeticiones Por otra parte los genes se solapan a veces en el genoma transcripcion sentido antisentido y podrian ser todavia ensamblados idealmente de forma separada El montaje de ESTs tambien es complicado por caracteristicas tales como cis splicing alternativo trans splicing polimorfismos de nucleotido simple recodificacion y modificaciones post transcripcionales Estas diferencias hacen a las nuevas generaciones de ensambladores menos aplicables al ensamblaje de ESTs Algoritmo voraz para el montado de secuencias EditarVease tambien Algoritmo voraz Dado un conjunto de fragmentos de secuencia el objetivo es encontrar la supersecuencia comun o secuencia origen de los fragmentos mas corta Calcular alineamientos por pares de todos los fragmentos Elegir los dos fragmentos con el mayor solapamiento Mezclar los fragmentos elegidos Repetir los pasos 2 y 3 hasta que solo quede un fragmento El resultado es una solucion suboptima al problema Referencias Editar DNA Baser automatic sequence assembly Ensamblador automatico de secuencias DNA Baser Phrap Ensamblador TIGR CAP3 AMOSVease tambien EditarAlineamiento de secuencias Datos Q740578 Obtenido de https es wikipedia org w index php title Montaje de secuencias amp oldid 128098396, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos