fbpx
Wikipedia

Secuenciación del ADN

La secuenciación del ADN es un conjunto de métodos y técnicas bioquímicas cuya finalidad es la determinación del orden de los nucleótidos (A, C, G y T) en un oligonucleótido de ADN. La secuencia de ADN constituye la información genética heredable que forman la base de los programas de desarrollo de los seres vivos (de procariotas, de eucariotas en el núcleo celular, y en los plásmidos, en la mitocondria y en cloroplastos de las plantas).[1]​ Así pues, determinar la secuencia de ADN es útil en el estudio de la investigación básica de los procesos biológicos fundamentales, así como en campos aplicados, como la investigación forense. Además, se puede utilizar la secuenciación del ADN para conocer las mutaciones somáticas, como las sustituciones de bases, generadas entre distintos organismos.

Gráfico de una secuencia de ADN obtenido por electroforesis capilar (electroferograma).

El desarrollo de la secuenciación del ADN ha acelerado significativamente la investigación y los descubrimientos en biología. Las técnicas actuales permiten realizar esta secuenciación a gran velocidad, lo cual ha sido de gran importancia para proyectos de secuenciación a gran escala como el Proyecto Genoma Humano. Otros proyectos relacionados, en ocasiones fruto de la colaboración investigadora a escala mundial, han establecido la secuencia completa de ADN de muchos genomas de animales, plantas y microorganismos. A pesar de las distintas técnicas que permiten secuenciar el ADN, no siempre se puede llegar a conocer el genoma completo de los organismos. Esto, puede llevar a errores en la reconstrucción de los linajes y en la estimación del tipo de mutaciones y del número de mitosis generadas.

Inicios

Durante treinta años la mayor parte de la secuenciación de ADN se llevó a cabo con el método de terminación de la cadena desarrollado por Frederick Sanger y colaboradores, en 1975.[2][3]​ Antes del desarrollo de métodos rápidos de secuenciación del ADN a principios de los 70 por Sanger en Inglaterra y Walter Gilbert y Allan Maxam en Harvard,[4][5]​ se utilizaban varios métodos de laboratorio. Por ejemplo, en 1973[6]​ Gilbert y Maxam publicaron una secuencia de 24 pares de bases utilizando un método conocido como "de punto corrido" (wandering spot).

La secuenciación del ARN, que por razones técnicas es más sencilla de llevar a cabo que la del ADN, se desarrolló con anterioridad a la del ADN. El mayor hito en la secuenciación del ARN, que data de la era previa al ADN recombinante, es la secuencia del primer gen completo y del genoma completo del Bacteriófago MS2, identificado y publicado por Walter Fiers y colaboradores de la Universidad de Gante.[7][8]

Secuenciación de Maxam-Gilbert

En 1976-1977, Allan Maxam y Walter Gilbert desarrollaron un método para secuenciar ADN basado en la modificación química del ADN y posterior escisión en bases específicas[9]​ Aunque Maxam y Gilbert publicaron su secuenciación química dos años después del trascendental artículo de Sanger y Coulson sobre su método de secuenciación "más-menos",[10][11]​ la secuenciación de Maxam y Gilbert rápidamente se hizo más popular hasta que se pudo utilizar ADN directamente, mientras que el método inicial de Sanger requería que cada comienzo de lectura fuera clonado para producir un ADN de cadena simple. No obstante, con el desarrollo y mejora del método de terminación de la cadena (ver más adelante), la secuenciación de Maxam y Gilbert ha quedado en desuso debido a su complejidad técnica, el uso extensivo de productos químicos peligrosos y dificultades para escalarla. Además, a diferencia del método de terminación de la cadena, los reactivos que se usan en el método de Maxam y Gilbert no se pueden adaptar para utilizarse en un kit biológico estándar.

En resumen, el método requiere marcaje radiactivo en uno de los extremos y la purificación del fragmento de ADN que se desea secuenciar. El tratamiento químico genera rupturas en una pequeña proporción de uno o dos de los cuatro nucleótidos en cada una de las cuatro reacciones (A, A+G, C, C+T). Los agentes químicos utilizados en cada caso son: dimetilsulfato, o DMS (A+G), ácido fórmico (A), hidrazina (C+T) e hidrazina más sales (C).De ese modo se genera una serie de fragmentos marcados a partir del final marcado radiactivamente hasta el primer lugar de "corte" en cada molécula.

Los fragmentos posteriormente se separan por tamaño mediante electroforesis en gel, separando los productos de las cuatro reacciones en cuatro carreras distintas, pero una al lado de la otra. El gel utilizado presenta condiciones desnaturalizantes, y un contenido en poliacrilamida que varía entre un 6 y un 20 %. Para visualizar los fragmentos generados en cada reacción, se hace una autoradiografía del mismo, lo que proporciona una imagen de una serie de bandas oscuras correspondientes a los fragmentos marcados con el radioisótopo, a partir de las cuales se puede inferir la secuencia.

Conocido en ocasiones como "secuenciación química", este método se originó en el estudio de las interacciones entre ADN y proteínas (huella genética), estructura de los ácidos nucleicos y modificaciones epigenéticas del ADN, y es en estos campos donde aún tiene aplicaciones importantes.

Métodos de terminación de la cadena

 
Parte de un gel de secuenciación con marcaje radiactivo.

Mientras que el método de secuenciación química de Maxam y Gilbert y el método más-menos de Sanger y Coulson eran órdenes de magnitud más rápidos que los métodos previos, el método de terminación de la cadena desarrollado por Sanger era incluso más eficiente y rápidamente se convirtió en el método de elección. La Técnica de Maxam-Gilbert requiere el uso de productos químicos altamente tóxicos y grandes cantidades de ADN marcado radiactivamente, mientras que el método de terminación de la cadena utiliza pocos reactivos tóxicos y cantidades menores de radiactividad. El principio clave del método de Sanger es el uso de didesoxinucleótidos trifosfato (ddNTPs) como terminadores de la cadena de ADN.

El método clásico de terminación de la cadena o método de Sanger necesita una hebra molde de ADN de cadena sencilla, un cebador de ADN, una ADN polimerasa con nucleótidos marcados radiactivamente o mediante fluorescencia y nucleótidos modificados que terminan la elongación de la cadena de ADN. La muestra de ADN se divide en cuatro reacciones de secuenciación separadas que contienen los cuatro desoxinucleótidos estándar (dATP, dGTP, dCTP and dTTP) y una ADN polimerasa. En cada reacción se añade solo uno de los cuatro didesoxinucleótidos (ddATP, ddGTP, ddCTP, o ddTTP). Estos didesoxinucleótidos terminan la elongación de la cadena al carecer un grupo 3'-OH que se necesita para la formación del enlace fosfodiéster entre dos nucleótidos durante la elongación de la cadena de ADN. La incorporación de un didesoxinucleótido en la cadena naciente de ADN termina su extensión, lo que produce varios fragmentos de ADN de longitud variable. Los didesoxinucleótidos se añaden a concentraciones lo suficientemente bajas como para que produzcan todas las posibilidades de fragmentos y al mismo tiempo sean suficientes para realizar la secuenciación.

Los fragmentos de ADN sintetizados y marcados de nuevo son desnaturalizados por calor y separados por tamaño (con una resolución de un solo nucleótido) mediante electroforesis en gel de poliacrilamida - urea. Cada una de las cuatro reacciones de síntesis se corre en carriles individuales (Carril A, T, G y C) y se visualizan las bandas de ADN mediante autoradiografía o luz ultravioleta, y la secuencia de ADN se puede leer directamente a partir de la placa de rayos X o de la imagen del gel. En la imagen de la derecha, la película de rayos-X se expuso directamente al gel de modo que las bandas oscuras corresponden a los fragmentos de ADN de diferentes longitudes. Una banda oscura en un carril indica un fragmento de ADN que es el resultado de una terminación de la cadena tras la incorporación de un didesoxinucleótido (ddATP, ddGTP, ddCTP, or ddTTP). El nucleótido terminal puede ser identificado de acuerdo al didesoxinucleótido que se añadió en la reacción que dio lugar a esa banda. Las posiciones relativas entre las cuatro calles se utilizan entonces para leer (de abajo arriba) la secuencia de ADN como se indica.

 
Los fragmentos de ADN se pueden marcar utilizando radiactividad o fluorescencia en el cebador (1), en la nueva cadena de ADN con dNTP marcado, o con un ddNTP marcado.

Existen algunas variaciones técnicas del método de secuenciación de terminación de la cadena. En un método, los fragmentos de ADN son marcados con nucleótidos marcados con fósforo radiactivo. Como alternativa se puede utilizar un cebador marcado en el extremo 5' mediante un colorante fluorescente.

Se siguen necesitando cuatro reacciones, pero los fragmentos de ADN marcados con colorantes se pueden leer utilizando un sistema óptico, lo que facilita un análisis más rápido y económico y su automatización. Esta variante se conoce como "secuenciación mediante colorantes acoplados al cebador" (dye-primer sequencing). El último avance de L Hood y colaboradores[12][13]​ desarrollando ddNTPs y cebadores con marcaje fluorescente señala el marco para una secuenciación de ADN automatizada y de alto rendimiento.

 
Escala de secuencia mediante secuenciación radiactiva comparada con máximos de fluorescencia.

Los diferentes métodos de terminación de la cadena han simplificado en gran medida la cantidad de trabajo y planificación necesaria para la secuenciación de ADN. Por ejemplo, el kit "Sequenase" de la casa USB Biochemicals, basado en el método de terminación de la cadena contiene la mayoría de los reactivos necesarios para la secuenciación, pre-divididos en alícuotas y listos para usar. Se pueden dar algunos problemas de secuenciación con el método de Sanger, como uniones no específicas del cebador al ADN, que afectan a la correcta interpretación de la secuencia de ADN. Además también puede afectar a la fidelidad de la secuencia obtenida estructuras secundarias internas de la cadena de ADN molde o ARN que pueda actuar de cebador al azar. Otros contaminantes que pueden afectar a la reacción son el ADN exógeno o inhibidores de la ADN polimerasa.

Secuenciación por terminador fluorescente

 
Electroforesis capilar.

Una alternativa al marcado del cebador es el marcado de los terminadores de la cadena, un método conocido como "secuenciación por terminador fluorescente". La mayor ventaja de este método es que la secuenciación se puede llevar a cabo en una sola reacción, en lugar de en cuatro reacciones como en el método del cebador marcado. En una secuenciación por terminador fluorescente se marcan cada uno de los cuatro didesoxinucleótidos que terminan la cadena con un colorante fluorescente diferente, con fluorescencias a diferentes longitudes de onda. Este método es atractivo por su gran capacidad y rapidez y actualmente es el método de referencia en la secuenciación automatizada con analizadores de secuencia controlados por computadora (ver más abajo). Entre sus limitaciones potenciales están los efectos de los terminadores fluorescentes en el fragmento de ADN, que produce alturas y formas de picos desiguales en los registros de secuencia de ADN del cromatograma tras la electroforesis capilar (ver ilustración de la derecha) Este problema se ha solventado en gran medida con la introducción de nuevos sistemas enzimáticos de polimerasas de ADN y colorantes que minimizan la variabilidad de la incorporación, así como métodos para eliminar los "pegotes de colorante" producidos por ciertas características químicas de los colorantes que pueden dar lugar a artefactos en los registros de secuencia de ADN. El método de secuenciado por terminador fluorescente junto con analizadores de secuencia de ADN de alto rendimiento se utiliza ahora para la inmensa mayoría de los proyectos de secuenciación, puesto que es más fácil de llevar a cabo y tiene un coste menor que los anteriores métodos de secuenciación.

Secuenciación alelo-específica por bisulfito

La secuenciación por bisulfito es una variante de la secuenciación Sanger utilizada para el mapeo de metilaciones alelo-específicas en los sitios CpG.

Metodologia:

Se extrae el ADN y se divide en dos fracciones que serán tratadas de manera diferente (fracciones A y B). A continuación, la fracción A se amplifica por PCR y se secuencia. Mientras que la fracción B se desnaturaliza y se incuba en presencia de bisulfito entre 15 y 20 horas. Dicho compuesto actúa desaminando las citosinas no metiladas del ADN convirtiéndolas en uracilo. Sin embargo, es incapaz de actuar sobre aquellas que se encuentren metiladas.

El siguiente paso consiste en la amplificación de la fracción B y su posterior secuenciación. Finalmente, se comparan ambas secuencias: aquellas citosinas que no estuviesen metiladas aparecerán como timinas en la fracción B, pero permanecerán como citosinas en la fracción A. De este modo podremos detectar todas las variaciones de citosina a timina en la fracción B. Estas variaciones nos indican que en la cadena de ADN original, la citosina no estaba metilada.

 
Secuenciación con bisulfito

La secuenciación alelo-específica por bisulfito presenta algunas limitaciones, entre las cuales se encuentran las siguientes:

-Conversión incompleta: la secuenciación mediante bisulfito depende de la conversión de cada uno de los residuos de citosina no metilados a uracilo. Si la conversión es incompleta, los posteriores análisis que se realicen interpretarán incorrectamente las citosinas no metiladas no convertidas en uracilo como citosinas metiladas, dando lugar a falsos positivos para la metilación.Sólo las citosinas que se encuentren en cadenas simples de ADN serán susceptibles de ser atacadas por bisulfito por lo que el paso de desnaturalización del ADN es crítico en este análisis.Es importante por tanto optimizar parámetros como la temperatura y la concentración de sales para mantener el ADN desnaturalizado y así permitir una conversión completa por bisulfito. Por otra parte también se ha propuesto que embebiendo el ADN en gel de agarosa se incrementa el grado de separación debido a que se mantienen las cadenas separadas.

-Degradación del ADN durante el tratamiento con bisulfito: es una de las limitaciones más importantes de este método y tiene lugar paralelamente a la conversión. Para que se produzca una total conversión son necesarias una serie de condiciones tales como largos tiempos de incubación, temperatura elevada y altas concentraciones de bisulfito. Estas condiciones en su conjunto pueden promover la degradación del ADN en una proporción elevada. Esto puede suponer un grave problema si se parte de muestras con una baja concentración de ADN o de muestras tomadas post mortem, además dicha degradación dará lugar a pequeñas roturas al azar a lo largo de la cadena de ADN lo que puede dar lugar a errores durante la amplificación por PCR.

-Desulfonación incompleta de los residuos de pirimidina: una inadecuada alcalinización de la solución puede tener como consecuencia una incompleta desulfonación de los residuos de pirimidina, lo cual a su vez puede afectar negativamente a las polimerasas de ADN, las cuales serán incapaces de replicar la cadena molde.Esta situación se puede evitar monitorizando el pH de la solución asegurando así que se produzca una desulfonación completa.

Pirosecuenciación

La pirosecuenciación es un método de secuenciación de ADN en tiempo real basado en la liberación de los pirofosfatos (PPi) que tiene lugar en la reacción de polimerización del ADN a partir de sus dNTPs. Inicialmente, esta metodología se empleaba para monitorizar de forma continua la actividad de la ADN-polimerasa. Frente a otras técnicas de secuenciación, esta variante no requiere correr en un gel los fragmentos de ADN generados en la reacción de polimerización, ni marcadores fluorescentes o ddNTPs (dideoxinucleótidos). Este método requiere de la preparación de una molécula monocatenaria de ADN a la cual se híbrida un pequeño cebador. Igualmente, la pirosecuenciación requiere de los 4 dNTPs, la polimerasa de ADN, así como tres enzimas: sulfurilasa (y el sustrato adenosina 5'- fosfosulfato o APS), luciferasa (y el sustrato luciferina) y apirasa. A medida que la reacción transcurra, se irá sintetizando la cadena complementaria y obteniendo una serie de picos de señal en el pirograma que nos permitirán determinar la secuencia. El proceso ocurre en ciclos sucesivos de tres pasos:

En el primero de ellos, se añade al medio de reacción uno de los 4 dNTPs el cual, si es el complementario a la base de la hebra molde que toca copiar, será procesado en la reacción de polimerización e incorporado a la cadena en extensión por la ADN-polimerasa, liberando un PPi.

Dicho PPi es posteriormente convertido a ATP al reaccionar con una molécula de adenosina 5’-fosfosulfato por medio de la ATP-sulforilasa.

Finalmente, tiene lugar la emisión de luz como consecuencia de la oxidación de la luciferina a oxiluciferina catalizada por la luciferasa de luciérnaga, consumiendo el ATP generado en la reacción anterior.

Si el dNTP que ha sido añadido al medio de reacción no es el complementario al que ocupa la posición que toca copiar, este es degradado por una enzima llamada apirasa antes de que se añada el siguiente dNTP. Esto último permite eliminar el exceso de dNTP, ya que de no ser este complementario y permanecer en el medio, al añadir posteriormente la base complementaria a la cadena en extensión, no sería posible discenir si la emisión de luz detectada se debe a la incorporación de uno u otro nucleótido.

El número medio de fotones emitidos por cadena molde es proporcional al número de nucleótidos incorporados a la cadena, siendo esta relación lineal únicamente para un número bajo de incorporaciones. La luminiscencia emitida es captada por una cámara acoplada a un sistema de cargas, el cual representa la señal en forma de pico en el pirograma.

La adición de uno o varios nucleótidos resulta en una reacción que genera una señal verde y es grabada por la cámara CCD. La fuerza de esta señal es proporcional al número de nucleótidos como, por ejemplo, las bandas de homopolímeros.

Así se ve que la información de la secuencia se representa en el pirograma en la que la altura de los picos refleja la cantidad de nucleótidos incorporada: picos de mayor altura indicarán que se ha incorporado el mismo nucleótido varias veces, esto es, que en la cadena de ADN dicho nucleótido se encuentra varias veces repetido de manera seguida.

Automatización y preparación de las muestras

 
Vista del comienzo de un ejemplo de lectura con el terminador (fondo coloreado).

Los instrumentos modernos automáticos de secuenciación del ADN (secuenciadores de ADN) pueden secuenciar más de 384 muestras marcadas por fluoresciencia de una sola vez y llevar a cabo 24 ciclos de secuenciación al día. No obstante, los secuenciadores automáticos de ADN llevan a cabo solamente separación del ADN basada en el tamaño (por electroforesis capilar), detección y registro de la coloración fluorescente, y los datos resultantes se dan como cromatogramas que registran los picos de fluorescencia. Se efectúan por separado las reacciones de secuenciación mediante un termociclador, lavado y resuspensión en una solución tamponada antes de pasar las muestras al secuenciador. En el pasado los operadores tenían que arreglar los extremos terminales de baja calidad (ver imagen de la derecha) de cada secuencia manualmente para eliminar los errores de secuenciación. Sin embargo, hoy se puede realizar mediante software como "Fast Chromatogram Viewer" el arreglo automático de los extremos terminales en grandes cantidades.[14]

Estrategias de secuenciación a gran escala

Los procedimientos actuales solo pueden secuenciar directamente fragmentos relativamente cortos (de entre 300-1000 nucleótidos de longitud) en una sola reacción.[15]​ El principal obstáculo para secuenciar fragmentos de ADN de una longitud superior a este límite es la capacidad insuficiente de separación para resolver grandes fragmentos de ADN cuyo tamaño difiere en un solo nucleótido. En cambio, las limitaciones impuestas por la incorporación de ddNTPs fueron resueltas en gran medida por Tabor, de la Harvard Medical, Carl Fueller, de USB biochemicals, y colaboradores.[16]

 
El ADN genómico se fragmenta en trozos al azar y se clonan en una biblioteca bacteriana. El ADN de los clones bacterianos individuales se secuencia y la secuencia se ensambla observando las regiones solapantes.

La secuenciación a gran escala persigue la secuenciación de fragmentos muy grandes de ADN. Incluso los genomas bacterianos relativamente pequeños constan de miles de nucleótidos y sólo el Cromosoma 1 humano consta de 246 millones de bases. Así pues, algunos enfoques abordan el problema cortando (con enzimas de restricción) o cizallando (mediante fuerzas mecánicas) fragmentos grandes para obtener otros más pequeños. El ADN fragmentado se clona en un Vector de ADN, normalmente un cromosoma artificial bacteriano (BAC) y amplificado en Escherichia coli. El ADN amplificado se puede purificar entonces a partir de las células bacterianas (Una desventaja de los clones bacterianos para el secuenciado es que algunas secuencias de ADN pueden ser inherentemente inclonables en todas las líneas bacterianas disponibles debido al efecto deletéreo de la secuencia clonada en la bacteria hospedadora u otros efectos). Estos fragmentos cortos de ADN purificados a partir de colonias bacterianas individuales se secuencian completamente y se ensamblan computacionalmente en una secuencia larga y contigua identificando las secuencias que se solapan entre ellas (por secuenciación por fuerza bruta o "shotgun"). Este método no requiere información preexistente sobre la secuencia de ADN y a menudo se la conoce como secuenciación de novo. Los intervalos entre las secuencias ensambladas se pueden rellenar mediante paseos de cebadores, a menudo mediante pasos de sub-clonado (o secuenciación a base de transposones dependiendo del tamaño del resto de región que quede por secuenciar). Todas estas estrategias implican efectuar muchas lecturas menores del ADN por alguno de los métodos anteriores y posteriormente ensamblarlos en secuencias contiguas. Las diferentes estrategias tienen diferentes inconvenientes en cuanto a velocidad y exactitud. El método de secuenciación por fuerza bruta es el más práctico para secuenciar genomas grandes, pero su proceso de ensamblaje es complejo y potencialmente proclive al error -en particular en presencia de repetición de secuencias. Debido a esto, el ensamblaje del genoma humano no está literalmente completo — las secuencias repetitivas de los centrómeros, telómeros y otras partes del cromosoma quedan como huecos en el ensamblaje del genoma. A pesar de contar con solo el 93 % del genoma ensamblado, el Proyecto Genoma Humano se declaró completado porque la definición de secuencia del genoma humano se limitó a la secuencia eucromática (completa al 99 % en aquel momento), para excluir esas regiones repetitivas intratables.[17]

 
Pasos para la resecuenciación. Preparación de la muestra:Extracción del ácido nucleico. Preparación del molde:Amplificación y preparación de una pequeña región de la región objetivo. (Click para ampliar)

El genoma humano tiene una longitud de unos 3000 millones de pares de bases;[18]​ si la longitud media de cada fragmento es de 500 bases, llevaría un mínimo de seis millones de fragmentos secuenciar el genoma humano (sin tener en cuenta el solapamiento, es decir si fuera posible hacerlo de una sola vez). Mantener el control de un número tan elevado de secuencias presenta desafíos significativos que sólo se pueden abordar mediante el desarrollo y la coordinación de varios algoritmos de procedimiento y computación, tales como el desarrollo y mantenimiento eficientes de bases de datos.

Se utiliza la Resecuenciación o secuenciación marcada para determinar un cambio en la secuencia de ADN a partir de la secuencia "de referencia". A menudo se efectúa utilizando la PCR para amplificar la región de interés (se necesita una secuencia de ADN preexistente para diseñar los cebadores de ADN). La resecuenciación realiza tres pasos, la extracción del ADN o ARN del tejido biológico, la amplificación del ARN o ADN (habitualmente por PCR) y después la secuenciación. La secuencia resultante se compara con la de referencia o con una muestra normal para detectar mutaciones.

Nuevos métodos de secuenciación

Secuenciación de alto rendimiento o "next-generation"

La elevada demanda de secuenciación de bajo costo ha dado lugar a las distintas tecnologías de secuenciación de alto rendimiento[19][20]​ que son capaces de paralelizar muchas operaciones de secuenciación, produciendo miles o millones a la vez, reduciendo los costos gracias a ello. Son las llamadas también secuenciaciones de nueva generación o "next-generation sequencing" (NGS).

Estos esfuerzos han sido financiados por instituciones públicas y privadas así como desarrolladas y comercializadas dentro de la empresa privada por las compañías de biotecnología. Se pretende que las tecnologías de secuenciación de alto rendimiento disminuyan los costes de secuenciación de las bibliotecas de ADN más allá de lo que se puede hacer con el método corriente del terminador marcado basado en la separación del ADN por electroforesis capilar.

Este tipo de secuenciación a gran escala ha permitido llevar a cabo una lectura eficiente del genoma humano llegando a encontrar incluso regiones no definidas en el genoma de referencia hg38, como apuntan ciertos estudios a coberturas superiores a las previamente utilizadas (≥30x, también denominada secuenciación profunda o "deep sequencing", con respecto a 4-20x de profundidad, cobertura media-baja), mejorando así las representaciones existentes.[21]​ Por otro lado, ha propiciado la identificación de SNPs aún no descritos contribuyendo a un aumento de la tasa de descubrimiento de variantes mediante el estudio de base de un gran número de genomas de diversas poblaciones humanas. Este hecho podría ser de utilidad en la identificación de nuevas variantes, fundamentalmente aquellas con relevancia clínica, siendo uno de los aspectos de nuevo abordaje en la actualidad.

Algunos de estos métodos de secuenciación de alto rendimiento son:

Amplificación clonal in vitro

Ya que los métodos de detección molecular frecuentemente no son lo suficientemente sensibles para la secuenciación de una sola molécula, la mayoría de los métodos utilizan un paso con clonación in vitro para generar muchas copias de cada molécula individual. Uno de los métodos es la PCR de emulsión, en la que se aíslan las moléculas individuales de ADN junto con microesferas recubiertas con cebadores en burbujas acuosas dentro de una fase oleosa. Posteriormente una PCR recubre cada microesfera con copias clonales de la bliblioteca de moléculas aisadas y seguidamente se inmovilizan para ser más tarde secuenciadas. La PCR de emulsión se usa en los métodos publicados por Margulis y colaboradores (comercializado por 454 Life Sciences, adquirido por Roche), Shendure y Porreca et al. (conocido como "secuenciación polony ", —término formado por polimerasa "pol" y colonia "colony"), y la secuenciación SOLiD (desarrollada por Agencourt y adquirida por Applied Biosystems).[22][23][24]​ Otro método para la amplificación clonal in vitro es la "PCR de puente", en la que los fragmentos se amplifican a partir de los cebadores unidos a una superficie sólida, desarrollados y usados por Solexa (de la que ahora es propietaria la empresa Illumina). Estos métodos producen ambos muchas localizaciones físicamente aisladas que contienen cada una muchas copias de un solo fragmento. El método con una única molécula desarrollado por el laboratorio de Stephen Quake (y más tarde comercializado por Helicos) se salta este paso de amplificación, fijando directamente las moléculas de ADN a una superficie.[25]

Illumina (Solexa)

En este método, se usan polimerasas diseñadas por la empresa y nucleótidos fluorescentes y de terminador reversible. Las hebras de ADN y los primers se pegan a un portaobjetos, y se lleva a cabo una amplificación por la polimerasa, de forma que se crean colonias locales de ADN o "clusters de ADN". Tras eso se usan las cuatro tipos de bases nucleotídicas de terminador reversible (bases RT), de forma que cuando una de ellas se una a la secuencia se pare la reacción. Una cámara recoge la fluorescencia etiquetada de los nucleótidos, y determinará qué nucleótido es el que se ha unido en esa posición. Aquellos nucleótidos que no se hayan unido serán lavados para continuar con el ciclo: una vez que se ha identificado la primera base y se hayan lavado las demás, se eliminará el terminal de bloqueo del extremo 3' que impedía continuar con la síntesis de la cadena. Se vuelve a echar una nueva tanda de nucleótidos y se continúa la secuenciación hasta completar toda la cadena de ADN.

A diferencia de la pirosecuenciación, por cada ciclo se incorpora un único nucleótido, lo que ofrece ventajas como poder tomar las imágenes de forma retrasada y secuencialmente desde una única cámara.

Ion Torrent semiconductor

Este método de secuenciación se basa en la detección de iones de hidrógeno que se generan durante la polimerización del ADN. Posee micropocillos en los que se inserta la cadena de ADN a secuenciar, y se inunda con un único tipo de nucleótido.

La incorporación de un nucleótido en la polimerización de forma natural implica la formación de un enlace covalente, y la liberación de un pirofosfato y una carga positiva en forma de iones de hidrógeno. Aprovechando este hecho y la capacidad de los sensores de pH ISFET se ha desarrollado la tecnología del Ion Torrent semiconductor.

Si el nucleótido incorporado no es complementario a la secuencia de ADN a secuenciar, no se incorporará y no se dará ninguna reacción. Si el nucleótido es complementario a la cadena de ADN, se incorporará, provocando la liberación de un ión hidrógeno, cuya señal será recogido por un sensor de tipo ISFET. Tras cada ciclo, se lavan los nucleótidos para añadir un nuevo tipo, y la reacción se volverá a producir o no dependiendo de la secuencia los nucleótidos de la cadena a secuenciar. Al usar polimerasa naturales, la reacción ocurre a tiempo real.

En caso de que haya dos o más bases iguales consecutivas, se incorporarán múltiples nucleótidos en un único ciclo, se liberarán más átomos de hidrógeno y la señal electrónica será proporcionalmente mayor. Las ventajas de este sistema es la tecnología de medición eléctrica, sin necesidad del uso de medición óptica mediante nucleótidos modificados, que permiten que el proceso sea más barato tanto en los costes iniciales como de operación, así como su alta velocidad gracias a las polimerizaciones a tiempo real.

Secuenciación paralelizada

Una vez que las secuencias clonales de ADN se localizan físicamente en posiciones separadas de la superficie, se pueden utilizar varios métodos de secuenciación para determinar las secuencias de ADN de todas las localizaciones en paralelo. La "secuenciación por síntesis", como en la popular secuenciación electroforética con terminador marcado con colorante, usa el proceso de síntesis de ADN por ADN polimerasa para identificar las bases presentes en la molécula complementaria de ADN. Los métodos de terminador reversible (usados por Illumina y Helicos) utilizan versiones reversibles de terminadores marcados con colorante, añadiendo un nucleótido cada vez, y detectando la fluorescencia correspondiente a esa posición y removiendo posteriormente el grupo de bloqueo para permitir la polimerización de otro nucleótido. La pirosecuenciación (utilizada por 454) también usa la polimerización del ADN para añadir nucleótidos, añadiendo cada vez un tipo diferente y después detectando y cuantificando el número de nucleótidos añadidos a una determinada localización a través de la luz emitida por la liberación de los pirofosfatos unidos a ellos.[22][26]

Secuenciación por ligación

La "secuenciación por ligación" ("SOLiD sequencing") es otro método enzimático de secuenciación que emplea una ADN ligasa en lugar de una polimerasa para identificar la secuencia objetivo.[27][23][24]​ Se usa en el método polony y en la tecnología SOLiD que ofrece Applied Biosystems. Este método utiliza un reservorio de todos los oligonucleótidos posibles de una longitud dada, marcados de acuerdo con la posición secuenciada. Los oligonucleótidos se templan y ligan; el ligamiento preferente de las ADN ligasas por su secuencia específica produce una señal correspondiente a la secuencia complementaria en esa posición concreta.

Secuenciación de una única molécula de ADN

La secuenciación de una única molécula de ADN se conoce con el nombre de secuenciación "next next".

El método tSMS (siglas en Inglés de True Single-Molecule Sequencing) de Helicos es uno de los más modernos comercializados hoy día para la secuenciación. A diferencia de sus predecesores, no lleva a cabo ningún tipo de amplificación de la muestra, sino que es capaz de secuenciar a partir de una única molécula monocatenaria de ADN.

La muestra de ADN a analizar es troceada en fragmentos de entre 100 y 200 pares de bases. A continuación, se añade una cola de poli-A al extremo 3' de cada uno de estos fragmentos generados, estando el último de ellos marcado con una sonda fluorescente. Estas moléculas servirán directamente de sustrato para el proceso de secuenciación.

El siguiente paso consiste en la hidridación de los fragmentos sobre una micro-placa que contiene millones de poli-T pegados en su superficie. Dicha molécula de poli-T actuará además como cebador en el proceso de secuenciación.

A continuación, la micro-placa es introducida en un dispositivo dotado de una cámara CCD capaz de captar la fluorescencia emitida por cada uno de los fragmentos unidos a los poli-T, localizando así la posición de cada una de las moléculas en la placa. Una vez ha sacado una foto de toda la superficie, la micro-placa es tratada con una solución cuyos componentes producen la escisión del fluoróforo unido a la última adenina.

La reacción de secuenciación comienza mediante la adición de una solución con la polimerasa. A continuación, se añade una solución de un único tipo de nucleótido marcado con un fluoróforo (por ejemplo, la adenina). Entonces, la polimerasa cataliza su incorporación al cebador en aquellos casos donde corresponda, según la secuencia del fragmento concreto. El siguiente paso es el lavado de la solución para eliminar aquellos nucleótidos no unidos, tras lo cual la cámara toma una nueva foto de la superficie, localizando aquellas moléculas donde sí se han incorporado.

De nuevo, la placa se trata con una solución que elimina el fluoróforo de los nucleótidos incorporados. A continuación, el proceso se repite añadiendo una nueva solución con la polimerasa y un nucleótido diferente (por ejemplo la timina), e igualmente con la guanina y la citosina.

La magnitud de la técnica radica en que, simultáneamente se están secuenciando millones de fragmentos distintos de ADN; proceso que se puede seguir al mismo tiempo gracias a las imágenes captadas por la cámara. Un software analiza dichas imágenes y reconstruye las secuencias de cada fragmento, las cuales deben ser ensambladas posteriormente por programas informáticos.

Por otra parte, la secuenciación SMRT (del inglés single molecule real time sequencing ) de la empresa Pacific Biosciences también utiliza tecnologías que permiten la secuenciación de una molécula de El secuenciador PacBio contiene una ADN polimerasa fijada en el fondo de los pocillos que van a contener las muestras. Se utilizan nucleótidos con bases nitrogenadas modificadas que al incorporarse a la cadena en proceso de polimerización liberan fluorescencia, distinta para cada tipo de base, evitando de esta manera el lavado de nucleótidos como en el caso de la pirosecuenciación. La marca fluorescente se encuentra en el grupo fosfato de la base, de ahí que la señal se observe cuando se produce la incorporación de ésta a la cadena incipiente. El proceso de secuenciación es más rápido debido a que no es necesario lavar nucleótidos ni enzimas.

Las ventajas del secuenciador PacBio es que es capaz de realizar lecturas de una longitud media de 4200-8500 pb, con lecturas máximas de 30000 pb. La precisión y la sensibilidad son extremadamente altas, además de que se reduce el bias evitando la amplificación del ADN (caso de las secuenciaciones "next").

Otras tecnologías de secuenciación

Otros métodos de secuenciación por ADN podían tener ventajas en términos de eficiencia o exactitud. Al igual que la secuenciación por terminador marcado por tinción, están limitadas a la secuenciación de fragmentos únicos aislados. La "secuenciación por hibridación" es un método no enzimático que usa un chip de ADN. En este método, un único reservorio de ADN se marca mediante fluorescencia y se híbrida con un colección de secuencias conocidas. Si el ADN desconocido se híbrida fuertemente en un punto dado de entre las secuencias, haciéndole que "luzca", entonces se infiere que esa secuencia existe dentro de los ADN desconocidos que son secuenciados.[28]​ La espectrometría de masas también se puede usar para secuenciar las moléculas de ADN; las reacciones convencionales de terminación de la cadena producen moléculas de ADN de diferentes longitudes y la longitud de esos fragmentos se determina entonces por las diferencias de masa entre ellas (en lugar de utilizar una separación por gel).[29]

Hay nuevas propuestas para la secuenciación de ADN que están en desarrollo, pero aún no han sido probadas. Entre estas están el marcaje de la ADN polimerasa,[30]​ o la lectura de la secuencia a medida que la cadena de ADN pasa por nanoporos. (secuenciación de nanoporos).[31]

La secuenciación en el sistema nanoporo se puede resumir en los siguientes pasos:

  • El ADN a secuenciar se rompe en fragmentos de 100 kb aproximadamente.
  • Se desnaturalizan para obtener fragmentos monocatenarios y se hibridan con sondas que se unen a distintas partes del fragmento de ADN.
  • Los fragmentos de ADN con las sondas unidas se hacen pasar por el nanoporo, creando una curva de corriente frente a tiempo. Los picos que se forman determinan la posición de la sonda en cada fragmento de genómico.
  • De acuerdo con una serie de reglas del apareamiento de bases, se puede determinar la secuencia de ciertas porciones del fragmento de ADN genómico. Esto se hace para cada sonda y de manera paralela para todos los fragmentos de la librería de ADN.
  • El resultado es una especie de mapa que nos detalla las posiciones de las sondas para cada fragmento de la librería.
  • Por técnicas de análisis de los datos con un software se llega a conocer la secuencia de ADN.

Otras técnicas de secuenciación están basadas en microscopías, como la microscopía de fuerza atómica o el microscopio electrónico que se usan para identificar las posiciones de los nucleótidos individuales dentro de largos fragmentos de ADN marcando los nucleótidos con elementos pesados (p.ej. halógenos) para la detección visual y su registro.[32]​ En octubre de 2006 el NIH publicó un boletín de noticias describiendo las nuevas técnicas de secuenciación y anunciando varias concesiones de becas.[33]

No obstante, en 2011 se desarrolló una técnica de secuenciación en la cual no se utilizaban medio ópticos para detectar la secuencia de bases, sino que se detectaban pequeñas variaciones de pH a través de la liberación de protones durante el proceso de replicación de ADN. Se trata de la secuenciación por Ion Torrent, con el cual se gana en velocidad y escalabilidad.

En octubre de 2006, la Fundación Premio X estableció el Premio Arconte X (Archon X Prize), que premia con 10 millones de dólares al "primer equipo que pueda construir un dispositivo y utilizarlo para secuenciar 100 genomas humanos en 10 días o menos, con una exactud no menor a un error por cada 100 000 bases secuenciadas, con secuencias que cubran correctamente al menos el 98 % del genoma, y a un coste no mayor de 1000 dólares por genoma."[34]

Principales hitos en la secuenciación del ADN

  • 1972 desarrollo de la tecnología del ADN recombinante, que permite el aislamiento de fragmentos definidos de ADN; antes de este descubrimiento las únicas muestras accesibles para la secuenciación eran de bacteriófacos o virus de ADN.
  • 1982 GenBank comienza su andadura como repositorio público de secuencias de ADN.
    • Andre Marion y Sam Eletr de Hewlett Packard crean Applied Biosystems en mayo, que acaba siendo hegemónica en la secuenciación automatizada.
    • Akiyoshi Wada propone la secuenciación automatizada y recibe apoyo para la construcción de rebots con la ayuda de Hitachi.
  • 1984 científicos del Medical Research Council descifran la secuencia completa de ADN del virus de Epstein-Barr, de una longitud de 170 Kbases.
  • 1985 Kary Mullis y colaboradores desarrollan la reacción en cadena de la polimerasa, una técnica para replicar pequeños fragmentos de ADN.
  • 1986 el laboratorio de Leroy E. Hood en el Instituto de Tecnología de California y Smith anuncian la primera máquina semiautomática de secuenciación de ADN.
  • 1987 Applied Biosystems comercializa la primera máquina de secuenciación automatizada, el modelo ABI 370.
    • Walter Gilbert abandona el panel sobre el genoma del Consejo Nacional de Investigación de los Estados Unidos para crear Genome Corp., cuyo objetivo es la secuenciación y comercialización de los datos.
  • 1995 Venter, Fraser y Smith publican la primera secuencia de un organismo de vida libre, Haemophilus influenzae (tamaño del genoma: 1.8 Mbase).
    • Richard Mathies y colaboradores escriben un artículo sobre los marcajes colorantes en la secuenciación (PNAS, Mayo).[43]
    • Michael Reeve y Carl Fuller, polimerasa termoestable para la secuenciación.[16]
  • 1996 los socios internacionales del Proyecto Genoma Humano acuerdan publicar los datos de secuenciación en bases de datos públicas en 24 horas.
    • Un consorcio internacional publica la secuencia del genoma de la levadura S. cerevisiae (tamaño del genoma 12.1 Mbases).
    • Yoshihide Hayashizaki en el RIKEN completa el primer juego de cDNAs de longitud completa de ratón.
    • ABI presenta un sistema de electroforesis capiar, el analizador de secuencias ABI310.
  • 1997 Blattner, Plunkett y colaboradores. publican la secuencia de E. coli (Tamaño genómico 5 Mb).[44]
  • 1998 Phil Green y Brent Ewing de la Universidad de Washington publican “phred” para interpretar los datos de secuenciación(en uso desde 1995).[45]
    • Venter funda una nueva compañía, “Celera”; “Secuenciará el genoma humano en 3 años con un coste de $300m.”
    • Applied Biosystems presenta la máquina de secuenciación capilar 3700.
    • Wellcome dobla su financiación al Proyecto Genoma humano hasta $330 million para llegar a 1/3 de la secuencia.
    • Objetivos del NIH y el DOE: obtener un "borrador de trabajo" del genoma humano para 2001.
    • Sulston, Waterston y otros finalizan la secuencia de C. elegans (tamaño del genoma de 97 Mb).[46]
  • 1999 el NIH cambia la fecha de finalización del borrador a la primavera de 2000.
    • NIH lanza el proyecto de secuenciación del genoma del ratón.
    • primera secuencia del cromosoma humano 22 publicada.[47]
  • 2000 Celera y colaboradores secuencian la mosca de la fruta Drosophila melanogaster (Tamaño del genoma 180Mb) - lo que supone la validación del método de Venter de secuenciación por fuerza bruta. El consorcio Proyecto Genoma Humano y Celera debaten sobre aspectos relacionados con la publicación de datos.
    • el consorcio Proyecto Genoma Humano publica la secuencia del cromosoma 21.[48]
    • HGP y Celera anuncian conjuntamente los borradores de trabajo de la secuencia del genoma humano y prometen una publicación conjunta.
    • Las estimaciones del número de genes del genoma humano se sitúan entre 35 000 y 120 000. El consorcio internacional completa la primera secuencia de una planta, Arabidopsis thaliana (Tamaño del genoma 125 Mb).
  • 2001 el Proyecto Genoma Humano publica el borrador de la secuencia del genoma humano en Nature el 15 de febrero.[49]
    • Celera publica la secuencia del genoma humano.[50]
  • 2005 420.000 secuencias VariantSEQr de cebadores de resecuenciación humanas publicadas en la nueva base de datos NCBI Probe.
  • 2007 Por primera vez se secuencia un grupo de especies estrechamente relacionadas. Se secuencian 12 Drosofílidos (mosca de la fruta), haciendo despegar la era de la filogenómica.
    • Craig Venter publica su genoma diploide completo: el primer genoma humano en ser completamente secuenciado.[51]

Véase también

Referencias

  1. Robertson, John A. (agosto de 2003). «The $1000 Genome: Ethical and Legal Issues in Whole Genome Sequencing of Individuals». The American Journal of Bioethics 3 (3): 35-42. PMID 14735880. doi:10.1162/152651603322874762. 
  2. Sanger F, Coulson AR. A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J Mol Biol. 1975 Mayo 25;94(3):441–448
  3. Sanger F, Nicklen s, y Coulson AR, DNA sequencing with chain-terminating inhibitors, Proc Natl Acad Sci U S A. 1977 Diciembre; 74(12): 5463–5467
  4. Maxam AM, Gilbert W: A new method for sequencing DNA, Proc Natl Acad Sci U S A. 1977 Feb;74(2):560-4
  5. http://nobelprize.org/nobel_prizes/chemistry/laureates/1980/gilbert-lecture.pdf
  6. Walter Gilbert y Allan Maxam: The Nucleotide Sequence of the lac Operator, Proc Natl Acad Sci U S A. 1973 Diciembrer; 70(12 Pt 1-2): 3581–3584.
  7. Min Jou W, Haegeman G, Ysebaert M, Fiers W, Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein, Nature. 1972 Mayo 12;237(5350):82-8
  8. Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. Nature. 1976 Apr 8;260(5551):500-7.
  9. Maxam AM y Gilbert W (1977). «A new method for sequencing DNA». Proc Natl Acad Sci U S A 2 (74). PMID 265521. 
  10. Sanger, F y Coulson, AR (1975) J. Mol. Biol. 94, 441-448
  11. Unknown
  12. Nature. 1986 Jun 12-18;321(6071):674-9. Fluorescence detection in automated DNA sequence analysis
  13. Nucleic Acids Res. 1985 Apr 11;13(7):2399-412. The synthesis of oligonucleotides containing an aliphatic amino group at the 5' terminus: synthesis of fluorescent DNA primers for use in DNA sequence analysis.
  14. Fast Chromatogram Viewer
  15. 3730xl DNA Analyzer
  16. Reeve MA; Fuller CW (31 de agosto de 1995). «A novel thermostable polymerase for DNA sequencing.». Nature 376 (6543): 796-797. PMID 7651542. 
  17. International Human Genome Sequencing Consortium (2004). «Finishing the euchromatic sequence of the human genome.». Nature 431 (7011): 931-45. PMID 15496913.  paper available online
  18. . Archivado desde el original el 15 de marzo de 2008. Consultado el 2 de abril de 2008. 
  19. Neil Hall (2007). «Advanced sequencing technologies and their wider impact in microbiology». The Journal of Experimental Biology 209: 1518-1525. 
  20. G.M. Church (2006). «Genomes for ALL». Scientific Am. 294 (1): 47-54. PMID 16468433. 
  21. Telenti, A., et al. (2016). «Deep sequencing of 10,000 human genomes». Proceedings of the National Academy of Sciences: 201613365. 
  22. M. Margulies, et al. (2005). «Genome sequencing in microfabricated high-density picolitre reactors». Nature 437: 376-380. 
  23. J. Shendure, G.J. Porreca, N.B. Reppas, X. Lin, J.Pe McCutcheon, A.M. Rosenbaum, M.D. Wang, K. Zhang, R.D. Mitra and G.M. Church. «Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome». Science 309 (5741): 1728-1732. 
  24. . Archivado desde el original el 16 de mayo de 2008. Consultado el 16 de mayo de 2008.  - Applied Biosystems' SOLiD technology
  25. Braslavsky, I., Hebert, H., Kartalov, E. and Quake, S.R. (2003). «Sequence information can be obtained from single DNA molecules». Proceedings of the National Academy of Sciences of the United States of America 100: 3960-3964. Texto completo disponible online
  26. M. Ronaghi, S. Karamohamed, B. Pettersson, M. Uhlen, P. Nyren (1996). «Real-time DNA sequencing using detection of pyrophosphate release». Analytical Biochemistry 242: 84=89. 
  27. S. C. Macevicz, US Patent 5750341, filed 1995
  28. G.J. Hanna, V.A. Johnson, D.R. Kuritzkes, D.D. Richman, J. Martinez-Picado, L. Sutton, J.D. Hazelwood, R.T. D'Aquila (2000). «Comparison of sequencing by hybridization and cycle sequencing for genotyping of human immunodeficiency virus type 1 reverse transcriptase». Journal of Clinical Microbiology 38 (7): 2715. PMID 10878069.  Texto «2721» ignorado (ayuda)
  29. J.R. Edwards, H.Ruparel, J. Ju (2005). «Mass-spectrometry DNA sequencing». Mutation Research 573 (1-2): 3-12. 
  30. . Archivado desde el original el 7 de septiembre de 2008. Consultado el 5 de abril de 2008. 
  31. Grupo de Harvard de Nanoporos el 21 de febrero de 2002 en Wayback Machine.
  32. Aplicación # 20060029957 de USPTO asignado a ZS genetics http://www.freepatentsonline.com/20060029957.html
  33. NHGRI pretende efectuar secuenciaciones de ADN más rápidas y baratas, NIH News Release, 4 October 2006
  34. "Panorama del Premio: Premio Arconte X de Genómica"
  35. A new method for sequencing DNA
  36. Barry L. Karger; A. Guttman, A. S. Cohen, D. N. Heiger (15 de enero de 1990). «Analytical and micropreparative ultrahigh resolution of oligonucleotides by polyacrylamide gel high-performance capillary electrophoresis». Analytical Chemistry 62 (2): 137 - 141. doi 10.1021/ac00201a010. 
  37. Lloyd M. Smith; Luckey JA, Drossman H, Kostichka AJ, Mead DA, D'Cunha J, Norris TB (11 de agosto de 1990). «High speed DNA sequencing by capillary electrophoresis.». Nucleic Acids Research 18: 4417-4421. PMID 2388826 doi 10.1093/nar/18.15.4417. Consultado el 8 de octubre de 2007. 
  38. Norman J. Dovichi; H.P. Swerdlow, S. Wu , H.R. Harke (7 de septiembre de 1990). «Capillary gel electrophoresis for DNA sequencing: laser-induced fluorescence detection with the sheath flow cuvette». Journal of Chromatography 516: 61-67. PMID 2286629. 
  39. DC Page; Foote S; Vollrath D; Hilton A (2 de octubre de 1992). «The human Y chromosome: overlapping DNA clones spanning the euchromatic region.». Science 258 (5079): 60-66. PMID 1359640. 
  40. Daniel Cohen; Ilya Chumakov, Philippe Rigault, Sophie Guillou, Pierre Ougen, Alain Billaut, Ghislaine Guasconi, Patricia Gervy, Isabelle LeGall, Pascal Soularue, Laurent Grinas, Lydie Bougueleret, Christine Bellanné-Chantelot, Bruno Lacroix, Emmanuel Barillot, Philippe Gesnouin, Stuart Pook, Guy Vaysseix, Gerard Frelat, Annette Schmitz, Jean-Luc Sambucy, Assumpcio Bosch, Xavier Estivill, Jean Weissenbach, Alain Vignal, Harold Riethman, David Cox, David Patterson, Kathleen Gardiner, Masahira Hattori, Yoshiyuki Sakaki, Hitoshi Ichikawa, Misao Ohki, Denis Le Paslier, Roland Heilig, Stylianos Antonarakis (1 de octubre de 1992). «Continuum of overlapping clones spanning the entire human chromosome 21q». Nature 359 (6394): 380-387. PMID 1406950 doi 10.1038/359380a0. 
  41. E. S. Lander; Dietrich W; Katz H; Lincoln SE; Shin HS; Friedman J; Dracopoli NC (1992-06). «A Genetic Map of the Mouse Suitable for Typing Intraspecific Crosses». Genetics 131: 423-447. PMID 1353738. Consultado el 8 de octubre de 2007. 
  42. Jean Weissenbach; Gyapay G; Dib C; Vignal A; Morissette J; Millasseau P; Vaysseix G; Lathrop M. (29 de octubre de 1992). «A second-generation linkage map of the human genome». Nature 359: 794 - 801. PMID 1436057 doi 10.1038/359794a0. 
  43. R. A. Mathies; Ju J; Ruan C; Fuller CW; Glazer AN (9 de mayo de 1995). «Fluorescence Energy Transfer Dye-Labeled Primers for DNA Sequencing and Analysis». PNAS 92: 4347-4351. PMID 7753809. Consultado el 8 de octubre de 2007. 
  44. Frederick R. Blattner, Guy Plunkett III, Craig A. Bloch, Nicole T. Perna, Valerie Burland, Monica Riley, Julio Collado-Vides, Jeremy D. Glasner, Christopher K. Rode, George F. Mayhew, Jason Gregor, Nelson Wayne Davis, Heather A. Kirkpatrick, Michael A. Goeden, Debra J. Rose, Bob Mau, Ying Shao (5 de septiembre de 1997). «The Complete Genome Sequence of Escherichia coli K-12». Science 277 (5331): 1453-1462. PMID 9278503 doi 10.1126/science.277.5331.1453. 
  45. Phil Green, Brent Ewing (1998-03). «Base-calling of automated sequencer traces using phred. II. Error probabilities.». Genome Reserarch 8 (3): 186-94. PMID 9521922. 
  46. The C. elegans Sequencing Consortium (11 de diciembre de 1998). «Genome Sequence of the Nematode C. elegans: A Platform for Investigating Biology». Science 282 (5396): 2012-2018. PMID 9851916 doi 10.1126/science.282.5396.2012 10.1126/science.282.5396.2012. 
  47. Dunham I, Shimizu N, Roe BA, Chissoe S, Hunt AR, Collins JE, Bruskiewich R, Beare DM, Clamp M, Smink LJ, Ainscough R, Almeida JP, Babbage A, Bagguley C, Bailey J, Barlow K, Bates KN, Beasley O, Bird CP, Blakey S, Bridgeman AM, Buck D, Burgess J, Burrill WD, O'Brien KP, et al. (2 de diciembre de 1999). «The DNA sequence of human chromosome 22». Nature 402 (6761): 489-495. PMID 10591208. 
  48. Hattori, M., A. Fujiyama, T. D. Taylor, H. Watanabe, T. Yada, H.-S. Park, A. Toyoda, K. Ishii, Y. Totoki, D.-K. Choi, E. Soeda, M. Ohki, T. Takagi, Y. Sakaki; S. Taudienk, K. Blechschmidtk, A. Polleyk, U. Menzelk, J. Delabar, K. Kumpfk, R. Lehmannk, D. Patterson, K. Reichwaldk, A. Rumpk, M. Schillhabelk, A. Schudyk, W. Zimmermannk, A. Rosenthalk; J. KudohI, K. ShibuyaI, K. KawasakiI, S. AsakawaI, A. ShintaniI, T. SasakiI, K. NagamineI, S. MitsuyamaI, S. E. Antonarakis, S. MinoshimaI, N. ShimizuI, G. Nordsiek, K. Hornischer, P. Brandt, M. Scharfe, O. SchoÈn, A. Desario, J. Reichelt, G. Kauer, H. Bloecker; J. Ramser, A. Beck, S. Klages, S. Hennig, L. Riesselmann, E. Dagand, T. Haaf, S. Wehrmeyer, K. Borzym, K. Gardiner, D. Nizetickk, F. Francis, H. Lehrach, R. Reinhardt, and M.-L. Yaspo, (2000). The DNA sequence of human chromosome 21. Nature 405: 311-319.
  49. «Initial sequencing and analysis of the human genome». Nature 409 (6822): 860-921. 15 de febrero de 2001. PMID 11237011. 
  50. J. C. Venter; et al (16 de febrero de 2001). «The sequence of the human genome.». Science 291 (5507): 1304-51. PMID 11181995 doi 10.1126/science.1058040. 
  51. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, et al. (2007) The Diploid Genome Sequence of an Individual Human. PLoS Biol 5(10): e254 doi:10.1371/journal.pbio.0050254
  • Ansorge, W.J. (2009). «Next-generation DNA sequencing techniques.». New Biotechnology 25 (4). 
  • Diggle, M. A. (2004). «Pyrosequencing™». Molecular Biotechnology 28. 
  • França, L. T. C. (2002). «A review of DNA sequencing techniques.». Quarterly Reviews of Biophysics 35 (2). 
  • Hutchinson, C. A. (2007). «sequencing: bench to bedside and beyond.». Nucleic Acids Research 35 (18). 

Enlaces externos

  • Tecnología básica para el marcaje del ADN con átomos pesados para imágenes directas usando la microscopía electrónica de transmisión y la secuenciación de cadenas de más de 10 000 pares de bases por imagen capturada: .
  • Plataforma de secuenciación de ADN Millegen
  •   Datos: Q380546
  •   Multimedia: DNA sequencing

secuenciación, secuenciación, conjunto, métodos, técnicas, bioquímicas, cuya, finalidad, determinación, orden, nucleótidos, oligonucleótido, secuencia, constituye, información, genética, heredable, forman, base, programas, desarrollo, seres, vivos, procariotas. La secuenciacion del ADN es un conjunto de metodos y tecnicas bioquimicas cuya finalidad es la determinacion del orden de los nucleotidos A C G y T en un oligonucleotido de ADN La secuencia de ADN constituye la informacion genetica heredable que forman la base de los programas de desarrollo de los seres vivos de procariotas de eucariotas en el nucleo celular y en los plasmidos en la mitocondria y en cloroplastos de las plantas 1 Asi pues determinar la secuencia de ADN es util en el estudio de la investigacion basica de los procesos biologicos fundamentales asi como en campos aplicados como la investigacion forense Ademas se puede utilizar la secuenciacion del ADN para conocer las mutaciones somaticas como las sustituciones de bases generadas entre distintos organismos Grafico de una secuencia de ADN obtenido por electroforesis capilar electroferograma El desarrollo de la secuenciacion del ADN ha acelerado significativamente la investigacion y los descubrimientos en biologia Las tecnicas actuales permiten realizar esta secuenciacion a gran velocidad lo cual ha sido de gran importancia para proyectos de secuenciacion a gran escala como el Proyecto Genoma Humano Otros proyectos relacionados en ocasiones fruto de la colaboracion investigadora a escala mundial han establecido la secuencia completa de ADN de muchos genomas de animales plantas y microorganismos A pesar de las distintas tecnicas que permiten secuenciar el ADN no siempre se puede llegar a conocer el genoma completo de los organismos Esto puede llevar a errores en la reconstruccion de los linajes y en la estimacion del tipo de mutaciones y del numero de mitosis generadas Indice 1 Inicios 2 Secuenciacion de Maxam Gilbert 3 Metodos de terminacion de la cadena 3 1 Secuenciacion por terminador fluorescente 3 2 Secuenciacion alelo especifica por bisulfito 4 Pirosecuenciacion 5 Automatizacion y preparacion de las muestras 6 Estrategias de secuenciacion a gran escala 7 Nuevos metodos de secuenciacion 7 1 Secuenciacion de alto rendimiento o next generation 7 2 Secuenciacion de una unica molecula de ADN 7 3 Otras tecnologias de secuenciacion 8 Principales hitos en la secuenciacion del ADN 9 Vease tambien 10 Referencias 11 Enlaces externosInicios EditarDurante treinta anos la mayor parte de la secuenciacion de ADN se llevo a cabo con el metodo de terminacion de la cadena desarrollado por Frederick Sanger y colaboradores en 1975 2 3 Antes del desarrollo de metodos rapidos de secuenciacion del ADN a principios de los 70 por Sanger en Inglaterra y Walter Gilbert y Allan Maxam en Harvard 4 5 se utilizaban varios metodos de laboratorio Por ejemplo en 1973 6 Gilbert y Maxam publicaron una secuencia de 24 pares de bases utilizando un metodo conocido como de punto corrido wandering spot La secuenciacion del ARN que por razones tecnicas es mas sencilla de llevar a cabo que la del ADN se desarrollo con anterioridad a la del ADN El mayor hito en la secuenciacion del ARN que data de la era previa al ADN recombinante es la secuencia del primer gen completo y del genoma completo del Bacteriofago MS2 identificado y publicado por Walter Fiers y colaboradores de la Universidad de Gante 7 8 Secuenciacion de Maxam Gilbert EditarArticulo principal Secuenciacion Maxam Gilbert En 1976 1977 Allan Maxam y Walter Gilbert desarrollaron un metodo para secuenciar ADN basado en la modificacion quimica del ADN y posterior escision en bases especificas 9 Aunque Maxam y Gilbert publicaron su secuenciacion quimica dos anos despues del trascendental articulo de Sanger y Coulson sobre su metodo de secuenciacion mas menos 10 11 la secuenciacion de Maxam y Gilbert rapidamente se hizo mas popular hasta que se pudo utilizar ADN directamente mientras que el metodo inicial de Sanger requeria que cada comienzo de lectura fuera clonado para producir un ADN de cadena simple No obstante con el desarrollo y mejora del metodo de terminacion de la cadena ver mas adelante la secuenciacion de Maxam y Gilbert ha quedado en desuso debido a su complejidad tecnica el uso extensivo de productos quimicos peligrosos y dificultades para escalarla Ademas a diferencia del metodo de terminacion de la cadena los reactivos que se usan en el metodo de Maxam y Gilbert no se pueden adaptar para utilizarse en un kit biologico estandar En resumen el metodo requiere marcaje radiactivo en uno de los extremos y la purificacion del fragmento de ADN que se desea secuenciar El tratamiento quimico genera rupturas en una pequena proporcion de uno o dos de los cuatro nucleotidos en cada una de las cuatro reacciones A A G C C T Los agentes quimicos utilizados en cada caso son dimetilsulfato o DMS A G acido formico A hidrazina C T e hidrazina mas sales C De ese modo se genera una serie de fragmentos marcados a partir del final marcado radiactivamente hasta el primer lugar de corte en cada molecula Los fragmentos posteriormente se separan por tamano mediante electroforesis en gel separando los productos de las cuatro reacciones en cuatro carreras distintas pero una al lado de la otra El gel utilizado presenta condiciones desnaturalizantes y un contenido en poliacrilamida que varia entre un 6 y un 20 Para visualizar los fragmentos generados en cada reaccion se hace una autoradiografia del mismo lo que proporciona una imagen de una serie de bandas oscuras correspondientes a los fragmentos marcados con el radioisotopo a partir de las cuales se puede inferir la secuencia Conocido en ocasiones como secuenciacion quimica este metodo se origino en el estudio de las interacciones entre ADN y proteinas huella genetica estructura de los acidos nucleicos y modificaciones epigeneticas del ADN y es en estos campos donde aun tiene aplicaciones importantes Metodos de terminacion de la cadena EditarArticulo principal Metodo de Sanger Parte de un gel de secuenciacion con marcaje radiactivo Mientras que el metodo de secuenciacion quimica de Maxam y Gilbert y el metodo mas menos de Sanger y Coulson eran ordenes de magnitud mas rapidos que los metodos previos el metodo de terminacion de la cadena desarrollado por Sanger era incluso mas eficiente y rapidamente se convirtio en el metodo de eleccion La Tecnica de Maxam Gilbert requiere el uso de productos quimicos altamente toxicos y grandes cantidades de ADN marcado radiactivamente mientras que el metodo de terminacion de la cadena utiliza pocos reactivos toxicos y cantidades menores de radiactividad El principio clave del metodo de Sanger es el uso de didesoxinucleotidos trifosfato ddNTPs como terminadores de la cadena de ADN El metodo clasico de terminacion de la cadena o metodo de Sanger necesita una hebra molde de ADN de cadena sencilla un cebador de ADN una ADN polimerasa con nucleotidos marcados radiactivamente o mediante fluorescencia y nucleotidos modificados que terminan la elongacion de la cadena de ADN La muestra de ADN se divide en cuatro reacciones de secuenciacion separadas que contienen los cuatro desoxinucleotidos estandar dATP dGTP dCTP and dTTP y una ADN polimerasa En cada reaccion se anade solo uno de los cuatro didesoxinucleotidos ddATP ddGTP ddCTP o ddTTP Estos didesoxinucleotidos terminan la elongacion de la cadena al carecer un grupo 3 OH que se necesita para la formacion del enlace fosfodiester entre dos nucleotidos durante la elongacion de la cadena de ADN La incorporacion de un didesoxinucleotido en la cadena naciente de ADN termina su extension lo que produce varios fragmentos de ADN de longitud variable Los didesoxinucleotidos se anaden a concentraciones lo suficientemente bajas como para que produzcan todas las posibilidades de fragmentos y al mismo tiempo sean suficientes para realizar la secuenciacion Los fragmentos de ADN sintetizados y marcados de nuevo son desnaturalizados por calor y separados por tamano con una resolucion de un solo nucleotido mediante electroforesis en gel de poliacrilamida urea Cada una de las cuatro reacciones de sintesis se corre en carriles individuales Carril A T G y C y se visualizan las bandas de ADN mediante autoradiografia o luz ultravioleta y la secuencia de ADN se puede leer directamente a partir de la placa de rayos X o de la imagen del gel En la imagen de la derecha la pelicula de rayos X se expuso directamente al gel de modo que las bandas oscuras corresponden a los fragmentos de ADN de diferentes longitudes Una banda oscura en un carril indica un fragmento de ADN que es el resultado de una terminacion de la cadena tras la incorporacion de un didesoxinucleotido ddATP ddGTP ddCTP or ddTTP El nucleotido terminal puede ser identificado de acuerdo al didesoxinucleotido que se anadio en la reaccion que dio lugar a esa banda Las posiciones relativas entre las cuatro calles se utilizan entonces para leer de abajo arriba la secuencia de ADN como se indica Los fragmentos de ADN se pueden marcar utilizando radiactividad o fluorescencia en el cebador 1 en la nueva cadena de ADN con dNTP marcado o con un ddNTP marcado Existen algunas variaciones tecnicas del metodo de secuenciacion de terminacion de la cadena En un metodo los fragmentos de ADN son marcados con nucleotidos marcados con fosforo radiactivo Como alternativa se puede utilizar un cebador marcado en el extremo 5 mediante un colorante fluorescente Se siguen necesitando cuatro reacciones pero los fragmentos de ADN marcados con colorantes se pueden leer utilizando un sistema optico lo que facilita un analisis mas rapido y economico y su automatizacion Esta variante se conoce como secuenciacion mediante colorantes acoplados al cebador dye primer sequencing El ultimo avance de L Hood y colaboradores 12 13 desarrollando ddNTPs y cebadores con marcaje fluorescente senala el marco para una secuenciacion de ADN automatizada y de alto rendimiento Escala de secuencia mediante secuenciacion radiactiva comparada con maximos de fluorescencia Los diferentes metodos de terminacion de la cadena han simplificado en gran medida la cantidad de trabajo y planificacion necesaria para la secuenciacion de ADN Por ejemplo el kit Sequenase de la casa USB Biochemicals basado en el metodo de terminacion de la cadena contiene la mayoria de los reactivos necesarios para la secuenciacion pre divididos en alicuotas y listos para usar Se pueden dar algunos problemas de secuenciacion con el metodo de Sanger como uniones no especificas del cebador al ADN que afectan a la correcta interpretacion de la secuencia de ADN Ademas tambien puede afectar a la fidelidad de la secuencia obtenida estructuras secundarias internas de la cadena de ADN molde o ARN que pueda actuar de cebador al azar Otros contaminantes que pueden afectar a la reaccion son el ADN exogeno o inhibidores de la ADN polimerasa Secuenciacion por terminador fluorescente Editar Electroforesis capilar Una alternativa al marcado del cebador es el marcado de los terminadores de la cadena un metodo conocido como secuenciacion por terminador fluorescente La mayor ventaja de este metodo es que la secuenciacion se puede llevar a cabo en una sola reaccion en lugar de en cuatro reacciones como en el metodo del cebador marcado En una secuenciacion por terminador fluorescente se marcan cada uno de los cuatro didesoxinucleotidos que terminan la cadena con un colorante fluorescente diferente con fluorescencias a diferentes longitudes de onda Este metodo es atractivo por su gran capacidad y rapidez y actualmente es el metodo de referencia en la secuenciacion automatizada con analizadores de secuencia controlados por computadora ver mas abajo Entre sus limitaciones potenciales estan los efectos de los terminadores fluorescentes en el fragmento de ADN que produce alturas y formas de picos desiguales en los registros de secuencia de ADN del cromatograma tras la electroforesis capilar ver ilustracion de la derecha Este problema se ha solventado en gran medida con la introduccion de nuevos sistemas enzimaticos de polimerasas de ADN y colorantes que minimizan la variabilidad de la incorporacion asi como metodos para eliminar los pegotes de colorante producidos por ciertas caracteristicas quimicas de los colorantes que pueden dar lugar a artefactos en los registros de secuencia de ADN El metodo de secuenciado por terminador fluorescente junto con analizadores de secuencia de ADN de alto rendimiento se utiliza ahora para la inmensa mayoria de los proyectos de secuenciacion puesto que es mas facil de llevar a cabo y tiene un coste menor que los anteriores metodos de secuenciacion Secuenciacion alelo especifica por bisulfito Editar Articulo principal Secuenciacion por bisulfito La secuenciacion por bisulfito es una variante de la secuenciacion Sanger utilizada para el mapeo de metilaciones alelo especificas en los sitios CpG Metodologia Se extrae el ADN y se divide en dos fracciones que seran tratadas de manera diferente fracciones A y B A continuacion la fraccion A se amplifica por PCR y se secuencia Mientras que la fraccion B se desnaturaliza y se incuba en presencia de bisulfito entre 15 y 20 horas Dicho compuesto actua desaminando las citosinas no metiladas del ADN convirtiendolas en uracilo Sin embargo es incapaz de actuar sobre aquellas que se encuentren metiladas El siguiente paso consiste en la amplificacion de la fraccion B y su posterior secuenciacion Finalmente se comparan ambas secuencias aquellas citosinas que no estuviesen metiladas apareceran como timinas en la fraccion B pero permaneceran como citosinas en la fraccion A De este modo podremos detectar todas las variaciones de citosina a timina en la fraccion B Estas variaciones nos indican que en la cadena de ADN original la citosina no estaba metilada Secuenciacion con bisulfito La secuenciacion alelo especifica por bisulfito presenta algunas limitaciones entre las cuales se encuentran las siguientes Conversion incompleta la secuenciacion mediante bisulfito depende de la conversion de cada uno de los residuos de citosina no metilados a uracilo Si la conversion es incompleta los posteriores analisis que se realicen interpretaran incorrectamente las citosinas no metiladas no convertidas en uracilo como citosinas metiladas dando lugar a falsos positivos para la metilacion Solo las citosinas que se encuentren en cadenas simples de ADN seran susceptibles de ser atacadas por bisulfito por lo que el paso de desnaturalizacion del ADN es critico en este analisis Es importante por tanto optimizar parametros como la temperatura y la concentracion de sales para mantener el ADN desnaturalizado y asi permitir una conversion completa por bisulfito Por otra parte tambien se ha propuesto que embebiendo el ADN en gel de agarosa se incrementa el grado de separacion debido a que se mantienen las cadenas separadas Degradacion del ADN durante el tratamiento con bisulfito es una de las limitaciones mas importantes de este metodo y tiene lugar paralelamente a la conversion Para que se produzca una total conversion son necesarias una serie de condiciones tales como largos tiempos de incubacion temperatura elevada y altas concentraciones de bisulfito Estas condiciones en su conjunto pueden promover la degradacion del ADN en una proporcion elevada Esto puede suponer un grave problema si se parte de muestras con una baja concentracion de ADN o de muestras tomadas post mortem ademas dicha degradacion dara lugar a pequenas roturas al azar a lo largo de la cadena de ADN lo que puede dar lugar a errores durante la amplificacion por PCR Desulfonacion incompleta de los residuos de pirimidina una inadecuada alcalinizacion de la solucion puede tener como consecuencia una incompleta desulfonacion de los residuos de pirimidina lo cual a su vez puede afectar negativamente a las polimerasas de ADN las cuales seran incapaces de replicar la cadena molde Esta situacion se puede evitar monitorizando el pH de la solucion asegurando asi que se produzca una desulfonacion completa Pirosecuenciacion EditarLa pirosecuenciacion es un metodo de secuenciacion de ADN en tiempo real basado en la liberacion de los pirofosfatos PPi que tiene lugar en la reaccion de polimerizacion del ADN a partir de sus dNTPs Inicialmente esta metodologia se empleaba para monitorizar de forma continua la actividad de la ADN polimerasa Frente a otras tecnicas de secuenciacion esta variante no requiere correr en un gel los fragmentos de ADN generados en la reaccion de polimerizacion ni marcadores fluorescentes o ddNTPs dideoxinucleotidos Este metodo requiere de la preparacion de una molecula monocatenaria de ADN a la cual se hibrida un pequeno cebador Igualmente la pirosecuenciacion requiere de los 4 dNTPs la polimerasa de ADN asi como tres enzimas sulfurilasa y el sustrato adenosina 5 fosfosulfato o APS luciferasa y el sustrato luciferina y apirasa A medida que la reaccion transcurra se ira sintetizando la cadena complementaria y obteniendo una serie de picos de senal en el pirograma que nos permitiran determinar la secuencia El proceso ocurre en ciclos sucesivos de tres pasos En el primero de ellos se anade al medio de reaccion uno de los 4 dNTPs el cual si es el complementario a la base de la hebra molde que toca copiar sera procesado en la reaccion de polimerizacion e incorporado a la cadena en extension por la ADN polimerasa liberando un PPi Dicho PPi es posteriormente convertido a ATP al reaccionar con una molecula de adenosina 5 fosfosulfato por medio de la ATP sulforilasa Finalmente tiene lugar la emision de luz como consecuencia de la oxidacion de la luciferina a oxiluciferina catalizada por la luciferasa de luciernaga consumiendo el ATP generado en la reaccion anterior Si el dNTP que ha sido anadido al medio de reaccion no es el complementario al que ocupa la posicion que toca copiar este es degradado por una enzima llamada apirasa antes de que se anada el siguiente dNTP Esto ultimo permite eliminar el exceso de dNTP ya que de no ser este complementario y permanecer en el medio al anadir posteriormente la base complementaria a la cadena en extension no seria posible discenir si la emision de luz detectada se debe a la incorporacion de uno u otro nucleotido El numero medio de fotones emitidos por cadena molde es proporcional al numero de nucleotidos incorporados a la cadena siendo esta relacion lineal unicamente para un numero bajo de incorporaciones La luminiscencia emitida es captada por una camara acoplada a un sistema de cargas el cual representa la senal en forma de pico en el pirograma La adicion de uno o varios nucleotidos resulta en una reaccion que genera una senal verde y es grabada por la camara CCD La fuerza de esta senal es proporcional al numero de nucleotidos como por ejemplo las bandas de homopolimeros Asi se ve que la informacion de la secuencia se representa en el pirograma en la que la altura de los picos refleja la cantidad de nucleotidos incorporada picos de mayor altura indicaran que se ha incorporado el mismo nucleotido varias veces esto es que en la cadena de ADN dicho nucleotido se encuentra varias veces repetido de manera seguida Automatizacion y preparacion de las muestras Editar Vista del comienzo de un ejemplo de lectura con el terminador fondo coloreado Los instrumentos modernos automaticos de secuenciacion del ADN secuenciadores de ADN pueden secuenciar mas de 384 muestras marcadas por fluoresciencia de una sola vez y llevar a cabo 24 ciclos de secuenciacion al dia No obstante los secuenciadores automaticos de ADN llevan a cabo solamente separacion del ADN basada en el tamano por electroforesis capilar deteccion y registro de la coloracion fluorescente y los datos resultantes se dan como cromatogramas que registran los picos de fluorescencia Se efectuan por separado las reacciones de secuenciacion mediante un termociclador lavado y resuspension en una solucion tamponada antes de pasar las muestras al secuenciador En el pasado los operadores tenian que arreglar los extremos terminales de baja calidad ver imagen de la derecha de cada secuencia manualmente para eliminar los errores de secuenciacion Sin embargo hoy se puede realizar mediante software como Fast Chromatogram Viewer el arreglo automatico de los extremos terminales en grandes cantidades 14 Estrategias de secuenciacion a gran escala EditarLos procedimientos actuales solo pueden secuenciar directamente fragmentos relativamente cortos de entre 300 1000 nucleotidos de longitud en una sola reaccion 15 El principal obstaculo para secuenciar fragmentos de ADN de una longitud superior a este limite es la capacidad insuficiente de separacion para resolver grandes fragmentos de ADN cuyo tamano difiere en un solo nucleotido En cambio las limitaciones impuestas por la incorporacion de ddNTPs fueron resueltas en gran medida por Tabor de la Harvard Medical Carl Fueller de USB biochemicals y colaboradores 16 El ADN genomico se fragmenta en trozos al azar y se clonan en una biblioteca bacteriana El ADN de los clones bacterianos individuales se secuencia y la secuencia se ensambla observando las regiones solapantes La secuenciacion a gran escala persigue la secuenciacion de fragmentos muy grandes de ADN Incluso los genomas bacterianos relativamente pequenos constan de miles de nucleotidos y solo el Cromosoma 1 humano consta de 246 millones de bases Asi pues algunos enfoques abordan el problema cortando con enzimas de restriccion o cizallando mediante fuerzas mecanicas fragmentos grandes para obtener otros mas pequenos El ADN fragmentado se clona en un Vector de ADN normalmente un cromosoma artificial bacteriano BAC y amplificado en Escherichia coli El ADN amplificado se puede purificar entonces a partir de las celulas bacterianas Una desventaja de los clones bacterianos para el secuenciado es que algunas secuencias de ADN pueden ser inherentemente inclonables en todas las lineas bacterianas disponibles debido al efecto deletereo de la secuencia clonada en la bacteria hospedadora u otros efectos Estos fragmentos cortos de ADN purificados a partir de colonias bacterianas individuales se secuencian completamente y se ensamblan computacionalmente en una secuencia larga y contigua identificando las secuencias que se solapan entre ellas por secuenciacion por fuerza bruta o shotgun Este metodo no requiere informacion preexistente sobre la secuencia de ADN y a menudo se la conoce como secuenciacion de novo Los intervalos entre las secuencias ensambladas se pueden rellenar mediante paseos de cebadores a menudo mediante pasos de sub clonado o secuenciacion a base de transposones dependiendo del tamano del resto de region que quede por secuenciar Todas estas estrategias implican efectuar muchas lecturas menores del ADN por alguno de los metodos anteriores y posteriormente ensamblarlos en secuencias contiguas Las diferentes estrategias tienen diferentes inconvenientes en cuanto a velocidad y exactitud El metodo de secuenciacion por fuerza bruta es el mas practico para secuenciar genomas grandes pero su proceso de ensamblaje es complejo y potencialmente proclive al error en particular en presencia de repeticion de secuencias Debido a esto el ensamblaje del genoma humano no esta literalmente completo las secuencias repetitivas de los centromeros telomeros y otras partes del cromosoma quedan como huecos en el ensamblaje del genoma A pesar de contar con solo el 93 del genoma ensamblado el Proyecto Genoma Humano se declaro completado porque la definicion de secuencia del genoma humano se limito a la secuencia eucromatica completa al 99 en aquel momento para excluir esas regiones repetitivas intratables 17 Pasos para la resecuenciacion Preparacion de la muestra Extraccion del acido nucleico Preparacion del molde Amplificacion y preparacion de una pequena region de la region objetivo Click para ampliar El genoma humano tiene una longitud de unos 3000 millones de pares de bases 18 si la longitud media de cada fragmento es de 500 bases llevaria un minimo de seis millones de fragmentos secuenciar el genoma humano sin tener en cuenta el solapamiento es decir si fuera posible hacerlo de una sola vez Mantener el control de un numero tan elevado de secuencias presenta desafios significativos que solo se pueden abordar mediante el desarrollo y la coordinacion de varios algoritmos de procedimiento y computacion tales como el desarrollo y mantenimiento eficientes de bases de datos Se utiliza la Resecuenciacion o secuenciacion marcada para determinar un cambio en la secuencia de ADN a partir de la secuencia de referencia A menudo se efectua utilizando la PCR para amplificar la region de interes se necesita una secuencia de ADN preexistente para disenar los cebadores de ADN La resecuenciacion realiza tres pasos la extraccion del ADN o ARN del tejido biologico la amplificacion del ARN o ADN habitualmente por PCR y despues la secuenciacion La secuencia resultante se compara con la de referencia o con una muestra normal para detectar mutaciones Nuevos metodos de secuenciacion EditarSecuenciacion de alto rendimiento o next generation Editar La elevada demanda de secuenciacion de bajo costo ha dado lugar a las distintas tecnologias de secuenciacion de alto rendimiento 19 20 que son capaces de paralelizar muchas operaciones de secuenciacion produciendo miles o millones a la vez reduciendo los costos gracias a ello Son las llamadas tambien secuenciaciones de nueva generacion o next generation sequencing NGS Estos esfuerzos han sido financiados por instituciones publicas y privadas asi como desarrolladas y comercializadas dentro de la empresa privada por las companias de biotecnologia Se pretende que las tecnologias de secuenciacion de alto rendimiento disminuyan los costes de secuenciacion de las bibliotecas de ADN mas alla de lo que se puede hacer con el metodo corriente del terminador marcado basado en la separacion del ADN por electroforesis capilar Este tipo de secuenciacion a gran escala ha permitido llevar a cabo una lectura eficiente del genoma humano llegando a encontrar incluso regiones no definidas en el genoma de referencia hg38 como apuntan ciertos estudios a coberturas superiores a las previamente utilizadas 30x tambien denominada secuenciacion profunda o deep sequencing con respecto a 4 20x de profundidad cobertura media baja mejorando asi las representaciones existentes 21 Por otro lado ha propiciado la identificacion de SNPs aun no descritos contribuyendo a un aumento de la tasa de descubrimiento de variantes mediante el estudio de base de un gran numero de genomas de diversas poblaciones humanas Este hecho podria ser de utilidad en la identificacion de nuevas variantes fundamentalmente aquellas con relevancia clinica siendo uno de los aspectos de nuevo abordaje en la actualidad Algunos de estos metodos de secuenciacion de alto rendimiento son Amplificacion clonal in vitroYa que los metodos de deteccion molecular frecuentemente no son lo suficientemente sensibles para la secuenciacion de una sola molecula la mayoria de los metodos utilizan un paso con clonacion in vitro para generar muchas copias de cada molecula individual Uno de los metodos es la PCR de emulsion en la que se aislan las moleculas individuales de ADN junto con microesferas recubiertas con cebadores en burbujas acuosas dentro de una fase oleosa Posteriormente una PCR recubre cada microesfera con copias clonales de la bliblioteca de moleculas aisadas y seguidamente se inmovilizan para ser mas tarde secuenciadas La PCR de emulsion se usa en los metodos publicados por Margulis y colaboradores comercializado por 454 Life Sciences adquirido por Roche Shendure y Porreca et al conocido como secuenciacion polony termino formado por polimerasa pol y colonia colony y la secuenciacion SOLiD desarrollada por Agencourt y adquirida por Applied Biosystems 22 23 24 Otro metodo para la amplificacion clonal in vitro es la PCR de puente en la que los fragmentos se amplifican a partir de los cebadores unidos a una superficie solida desarrollados y usados por Solexa de la que ahora es propietaria la empresa Illumina Estos metodos producen ambos muchas localizaciones fisicamente aisladas que contienen cada una muchas copias de un solo fragmento El metodo con una unica molecula desarrollado por el laboratorio de Stephen Quake y mas tarde comercializado por Helicos se salta este paso de amplificacion fijando directamente las moleculas de ADN a una superficie 25 Illumina Solexa En este metodo se usan polimerasas disenadas por la empresa y nucleotidos fluorescentes y de terminador reversible Las hebras de ADN y los primers se pegan a un portaobjetos y se lleva a cabo una amplificacion por la polimerasa de forma que se crean colonias locales de ADN o clusters de ADN Tras eso se usan las cuatro tipos de bases nucleotidicas de terminador reversible bases RT de forma que cuando una de ellas se una a la secuencia se pare la reaccion Una camara recoge la fluorescencia etiquetada de los nucleotidos y determinara que nucleotido es el que se ha unido en esa posicion Aquellos nucleotidos que no se hayan unido seran lavados para continuar con el ciclo una vez que se ha identificado la primera base y se hayan lavado las demas se eliminara el terminal de bloqueo del extremo 3 que impedia continuar con la sintesis de la cadena Se vuelve a echar una nueva tanda de nucleotidos y se continua la secuenciacion hasta completar toda la cadena de ADN A diferencia de la pirosecuenciacion por cada ciclo se incorpora un unico nucleotido lo que ofrece ventajas como poder tomar las imagenes de forma retrasada y secuencialmente desde una unica camara Ion Torrent semiconductorEste metodo de secuenciacion se basa en la deteccion de iones de hidrogeno que se generan durante la polimerizacion del ADN Posee micropocillos en los que se inserta la cadena de ADN a secuenciar y se inunda con un unico tipo de nucleotido La incorporacion de un nucleotido en la polimerizacion de forma natural implica la formacion de un enlace covalente y la liberacion de un pirofosfato y una carga positiva en forma de iones de hidrogeno Aprovechando este hecho y la capacidad de los sensores de pH ISFET se ha desarrollado la tecnologia del Ion Torrent semiconductor Si el nucleotido incorporado no es complementario a la secuencia de ADN a secuenciar no se incorporara y no se dara ninguna reaccion Si el nucleotido es complementario a la cadena de ADN se incorporara provocando la liberacion de un ion hidrogeno cuya senal sera recogido por un sensor de tipo ISFET Tras cada ciclo se lavan los nucleotidos para anadir un nuevo tipo y la reaccion se volvera a producir o no dependiendo de la secuencia los nucleotidos de la cadena a secuenciar Al usar polimerasa naturales la reaccion ocurre a tiempo real En caso de que haya dos o mas bases iguales consecutivas se incorporaran multiples nucleotidos en un unico ciclo se liberaran mas atomos de hidrogeno y la senal electronica sera proporcionalmente mayor Las ventajas de este sistema es la tecnologia de medicion electrica sin necesidad del uso de medicion optica mediante nucleotidos modificados que permiten que el proceso sea mas barato tanto en los costes iniciales como de operacion asi como su alta velocidad gracias a las polimerizaciones a tiempo real Secuenciacion paralelizadaUna vez que las secuencias clonales de ADN se localizan fisicamente en posiciones separadas de la superficie se pueden utilizar varios metodos de secuenciacion para determinar las secuencias de ADN de todas las localizaciones en paralelo La secuenciacion por sintesis como en la popular secuenciacion electroforetica con terminador marcado con colorante usa el proceso de sintesis de ADN por ADN polimerasa para identificar las bases presentes en la molecula complementaria de ADN Los metodos de terminador reversible usados por Illumina y Helicos utilizan versiones reversibles de terminadores marcados con colorante anadiendo un nucleotido cada vez y detectando la fluorescencia correspondiente a esa posicion y removiendo posteriormente el grupo de bloqueo para permitir la polimerizacion de otro nucleotido La pirosecuenciacion utilizada por 454 tambien usa la polimerizacion del ADN para anadir nucleotidos anadiendo cada vez un tipo diferente y despues detectando y cuantificando el numero de nucleotidos anadidos a una determinada localizacion a traves de la luz emitida por la liberacion de los pirofosfatos unidos a ellos 22 26 Secuenciacion por ligacionLa secuenciacion por ligacion SOLiD sequencing es otro metodo enzimatico de secuenciacion que emplea una ADN ligasa en lugar de una polimerasa para identificar la secuencia objetivo 27 23 24 Se usa en el metodo polony y en la tecnologia SOLiD que ofrece Applied Biosystems Este metodo utiliza un reservorio de todos los oligonucleotidos posibles de una longitud dada marcados de acuerdo con la posicion secuenciada Los oligonucleotidos se templan y ligan el ligamiento preferente de las ADN ligasas por su secuencia especifica produce una senal correspondiente a la secuencia complementaria en esa posicion concreta Secuenciacion de una unica molecula de ADN Editar La secuenciacion de una unica molecula de ADN se conoce con el nombre de secuenciacion next next El metodo tSMS siglas en Ingles de True Single Molecule Sequencing de Helicos es uno de los mas modernos comercializados hoy dia para la secuenciacion A diferencia de sus predecesores no lleva a cabo ningun tipo de amplificacion de la muestra sino que es capaz de secuenciar a partir de una unica molecula monocatenaria de ADN La muestra de ADN a analizar es troceada en fragmentos de entre 100 y 200 pares de bases A continuacion se anade una cola de poli A al extremo 3 de cada uno de estos fragmentos generados estando el ultimo de ellos marcado con una sonda fluorescente Estas moleculas serviran directamente de sustrato para el proceso de secuenciacion El siguiente paso consiste en la hidridacion de los fragmentos sobre una micro placa que contiene millones de poli T pegados en su superficie Dicha molecula de poli T actuara ademas como cebador en el proceso de secuenciacion A continuacion la micro placa es introducida en un dispositivo dotado de una camara CCD capaz de captar la fluorescencia emitida por cada uno de los fragmentos unidos a los poli T localizando asi la posicion de cada una de las moleculas en la placa Una vez ha sacado una foto de toda la superficie la micro placa es tratada con una solucion cuyos componentes producen la escision del fluoroforo unido a la ultima adenina La reaccion de secuenciacion comienza mediante la adicion de una solucion con la polimerasa A continuacion se anade una solucion de un unico tipo de nucleotido marcado con un fluoroforo por ejemplo la adenina Entonces la polimerasa cataliza su incorporacion al cebador en aquellos casos donde corresponda segun la secuencia del fragmento concreto El siguiente paso es el lavado de la solucion para eliminar aquellos nucleotidos no unidos tras lo cual la camara toma una nueva foto de la superficie localizando aquellas moleculas donde si se han incorporado De nuevo la placa se trata con una solucion que elimina el fluoroforo de los nucleotidos incorporados A continuacion el proceso se repite anadiendo una nueva solucion con la polimerasa y un nucleotido diferente por ejemplo la timina e igualmente con la guanina y la citosina La magnitud de la tecnica radica en que simultaneamente se estan secuenciando millones de fragmentos distintos de ADN proceso que se puede seguir al mismo tiempo gracias a las imagenes captadas por la camara Un software analiza dichas imagenes y reconstruye las secuencias de cada fragmento las cuales deben ser ensambladas posteriormente por programas informaticos Por otra parte la secuenciacion SMRT del ingles single molecule real time sequencing de la empresa Pacific Biosciences tambien utiliza tecnologias que permiten la secuenciacion de una molecula de El secuenciador PacBio contiene una ADN polimerasa fijada en el fondo de los pocillos que van a contener las muestras Se utilizan nucleotidos con bases nitrogenadas modificadas que al incorporarse a la cadena en proceso de polimerizacion liberan fluorescencia distinta para cada tipo de base evitando de esta manera el lavado de nucleotidos como en el caso de la pirosecuenciacion La marca fluorescente se encuentra en el grupo fosfato de la base de ahi que la senal se observe cuando se produce la incorporacion de esta a la cadena incipiente El proceso de secuenciacion es mas rapido debido a que no es necesario lavar nucleotidos ni enzimas Las ventajas del secuenciador PacBio es que es capaz de realizar lecturas de una longitud media de 4200 8500 pb con lecturas maximas de 30000 pb La precision y la sensibilidad son extremadamente altas ademas de que se reduce el bias evitando la amplificacion del ADN caso de las secuenciaciones next Otras tecnologias de secuenciacion Editar Otros metodos de secuenciacion por ADN podian tener ventajas en terminos de eficiencia o exactitud Al igual que la secuenciacion por terminador marcado por tincion estan limitadas a la secuenciacion de fragmentos unicos aislados La secuenciacion por hibridacion es un metodo no enzimatico que usa un chip de ADN En este metodo un unico reservorio de ADN se marca mediante fluorescencia y se hibrida con un coleccion de secuencias conocidas Si el ADN desconocido se hibrida fuertemente en un punto dado de entre las secuencias haciendole que luzca entonces se infiere que esa secuencia existe dentro de los ADN desconocidos que son secuenciados 28 La espectrometria de masas tambien se puede usar para secuenciar las moleculas de ADN las reacciones convencionales de terminacion de la cadena producen moleculas de ADN de diferentes longitudes y la longitud de esos fragmentos se determina entonces por las diferencias de masa entre ellas en lugar de utilizar una separacion por gel 29 Hay nuevas propuestas para la secuenciacion de ADN que estan en desarrollo pero aun no han sido probadas Entre estas estan el marcaje de la ADN polimerasa 30 o la lectura de la secuencia a medida que la cadena de ADN pasa por nanoporos secuenciacion de nanoporos 31 La secuenciacion en el sistema nanoporo se puede resumir en los siguientes pasos El ADN a secuenciar se rompe en fragmentos de 100 kb aproximadamente Se desnaturalizan para obtener fragmentos monocatenarios y se hibridan con sondas que se unen a distintas partes del fragmento de ADN Los fragmentos de ADN con las sondas unidas se hacen pasar por el nanoporo creando una curva de corriente frente a tiempo Los picos que se forman determinan la posicion de la sonda en cada fragmento de genomico De acuerdo con una serie de reglas del apareamiento de bases se puede determinar la secuencia de ciertas porciones del fragmento de ADN genomico Esto se hace para cada sonda y de manera paralela para todos los fragmentos de la libreria de ADN El resultado es una especie de mapa que nos detalla las posiciones de las sondas para cada fragmento de la libreria Por tecnicas de analisis de los datos con un software se llega a conocer la secuencia de ADN Otras tecnicas de secuenciacion estan basadas en microscopias como la microscopia de fuerza atomica o el microscopio electronico que se usan para identificar las posiciones de los nucleotidos individuales dentro de largos fragmentos de ADN marcando los nucleotidos con elementos pesados p ej halogenos para la deteccion visual y su registro 32 En octubre de 2006 el NIH publico un boletin de noticias describiendo las nuevas tecnicas de secuenciacion y anunciando varias concesiones de becas 33 No obstante en 2011 se desarrollo una tecnica de secuenciacion en la cual no se utilizaban medio opticos para detectar la secuencia de bases sino que se detectaban pequenas variaciones de pH a traves de la liberacion de protones durante el proceso de replicacion de ADN Se trata de la secuenciacion por Ion Torrent con el cual se gana en velocidad y escalabilidad En octubre de 2006 la Fundacion Premio X establecio el Premio Arconte X Archon X Prize que premia con 10 millones de dolares al primer equipo que pueda construir un dispositivo y utilizarlo para secuenciar 100 genomas humanos en 10 dias o menos con una exactud no menor a un error por cada 100 000 bases secuenciadas con secuencias que cubran correctamente al menos el 98 del genoma y a un coste no mayor de 1000 dolares por genoma 34 Principales hitos en la secuenciacion del ADN Editar1953 descubrimiento de la estructura de la doble helice de ADN 1972 desarrollo de la tecnologia del ADN recombinante que permite el aislamiento de fragmentos definidos de ADN antes de este descubrimiento las unicas muestras accesibles para la secuenciacion eran de bacteriofacos o virus de ADN 1975 el primer genoma de ADN completamente secuenciado fue el del bacteriofago fX174 1977 Allan Maxam y Walter Gilbert publicaron el articulo Secuenciacion del ADN mediante degradacion quimicas 35 Fred Sanger independientemente publica Secuenciacion del ADN mediante sintesis enzimatica 1980 Fred Sanger y Wally Gilbert reciben el Premio Nobel de quimica 1982 GenBank comienza su andadura como repositorio publico de secuencias de ADN Andre Marion y Sam Eletr de Hewlett Packard crean Applied Biosystems en mayo que acaba siendo hegemonica en la secuenciacion automatizada Akiyoshi Wada propone la secuenciacion automatizada y recibe apoyo para la construccion de rebots con la ayuda de Hitachi 1984 cientificos del Medical Research Council descifran la secuencia completa de ADN del virus de Epstein Barr de una longitud de 170 Kbases 1985 Kary Mullis y colaboradores desarrollan la reaccion en cadena de la polimerasa una tecnica para replicar pequenos fragmentos de ADN 1986 el laboratorio de Leroy E Hood en el Instituto de Tecnologia de California y Smith anuncian la primera maquina semiautomatica de secuenciacion de ADN 1987 Applied Biosystems comercializa la primera maquina de secuenciacion automatizada el modelo ABI 370 Walter Gilbert abandona el panel sobre el genoma del Consejo Nacional de Investigacion de los Estados Unidos para crear Genome Corp cuyo objetivo es la secuenciacion y comercializacion de los datos 1990 el Instituto Nacional de salud de los Estados Unidos comienza ensayos a gran escala de secuenciacion de Mycoplasma capricolum Escherichia coli Caenorhabditis elegans and Saccharomyces cerevisiae a 75 centavos US base Lipman y Myers publican el algoritmo BLAST para la alineamiento de secuencias Barry Karger Enero 36 Lloyd Smith Agosto 37 y Norman Dovichi septiembre 38 hacen una publicacion sobre la electroforesis capilar 1991 Craig Venter desarrolla la estrategia para encontrar genes que se expresan con ESTs Expressed sequence tags Uberbacher desarrolla GRAIL un programa de prediccion de genes 1992 Craig Venter abandona el NIH para abrir el The Institute for Genomic Research Instituto para la investigacion genomica El TIGR el Trust Wellcome comienza su participacion en el Proyecto Genoma Humano Simon y al desarrollan los BACs cromosoma artificial bacteriano para el clonado Mapa fisico del primer cromosoma publicado Page y otros Cromosoma Y 39 Cohen y otros cromosoma 21 40 Lander mapa genetico completo del raton 41 Weissenbach mapa genetico humano completo 42 1993 El trust Wellcome y MRC crean el Centro Sanger cerca de Cambridge Reino Unido La base de datos GenBank se traslada de Los Alamos DOE al NCBI NIH 1995 Venter Fraser y Smith publican la primera secuencia de un organismo de vida libre Haemophilus influenzae tamano del genoma 1 8 Mbase Richard Mathies y colaboradores escriben un articulo sobre los marcajes colorantes en la secuenciacion PNAS Mayo 43 Michael Reeve y Carl Fuller polimerasa termoestable para la secuenciacion 16 1996 los socios internacionales del Proyecto Genoma Humano acuerdan publicar los datos de secuenciacion en bases de datos publicas en 24 horas Un consorcio internacional publica la secuencia del genoma de la levadura S cerevisiae tamano del genoma 12 1 Mbases Yoshihide Hayashizaki en el RIKEN completa el primer juego de cDNAs de longitud completa de raton ABI presenta un sistema de electroforesis capiar el analizador de secuencias ABI310 1997 Blattner Plunkett y colaboradores publican la secuencia de E coli Tamano genomico 5 Mb 44 1998 Phil Green y Brent Ewing de la Universidad de Washington publican phred para interpretar los datos de secuenciacion en uso desde 1995 45 Venter funda una nueva compania Celera Secuenciara el genoma humano en 3 anos con un coste de 300m Applied Biosystems presenta la maquina de secuenciacion capilar 3700 Wellcome dobla su financiacion al Proyecto Genoma humano hasta 330 million para llegar a 1 3 de la secuencia Objetivos del NIH y el DOE obtener un borrador de trabajo del genoma humano para 2001 Sulston Waterston y otros finalizan la secuencia de C elegans tamano del genoma de 97 Mb 46 1999 el NIH cambia la fecha de finalizacion del borrador a la primavera de 2000 NIH lanza el proyecto de secuenciacion del genoma del raton primera secuencia del cromosoma humano 22 publicada 47 2000 Celera y colaboradores secuencian la mosca de la fruta Drosophila melanogaster Tamano del genoma 180Mb lo que supone la validacion del metodo de Venter de secuenciacion por fuerza bruta El consorcio Proyecto Genoma Humano y Celera debaten sobre aspectos relacionados con la publicacion de datos el consorcio Proyecto Genoma Humano publica la secuencia del cromosoma 21 48 HGP y Celera anuncian conjuntamente los borradores de trabajo de la secuencia del genoma humano y prometen una publicacion conjunta Las estimaciones del numero de genes del genoma humano se situan entre 35 000 y 120 000 El consorcio internacional completa la primera secuencia de una planta Arabidopsis thaliana Tamano del genoma 125 Mb 2001 el Proyecto Genoma Humano publica el borrador de la secuencia del genoma humano en Nature el 15 de febrero 49 Celera publica la secuencia del genoma humano 50 2005 420 000 secuencias VariantSEQr de cebadores de resecuenciacion humanas publicadas en la nueva base de datos NCBI Probe 2007 Por primera vez se secuencia un grupo de especies estrechamente relacionadas Se secuencian 12 Drosofilidos mosca de la fruta haciendo despegar la era de la filogenomica Craig Venter publica su genoma diploide completo el primer genoma humano en ser completamente secuenciado 51 Vease tambien EditarAnalisis moleculares de ADN Secuenciacion 454 Proyecto Genoma Humano Medicina genomica Metagenomica Transistor de ADN de efecto de campo BioinformaticaReferencias Editar Robertson John A agosto de 2003 The 1000 Genome Ethical and Legal Issues in Whole Genome Sequencing of Individuals The American Journal of Bioethics 3 3 35 42 PMID 14735880 doi 10 1162 152651603322874762 Sanger F Coulson AR A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase J Mol Biol 1975 Mayo 25 94 3 441 448 Sanger F Nicklen s y Coulson AR DNA sequencing with chain terminating inhibitors Proc Natl Acad Sci U S A 1977 Diciembre 74 12 5463 5467 Maxam AM Gilbert W A new method for sequencing DNA Proc Natl Acad Sci U S A 1977 Feb 74 2 560 4 http nobelprize org nobel prizes chemistry laureates 1980 gilbert lecture pdf Walter Gilbert y Allan Maxam The Nucleotide Sequence of the lac Operator Proc Natl Acad Sci U S A 1973 Diciembrer 70 12 Pt 1 2 3581 3584 Min Jou W Haegeman G Ysebaert M Fiers W Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein Nature 1972 Mayo 12 237 5350 82 8 Complete nucleotide sequence of bacteriophage MS2 RNA primary and secondary structure of the replicase gene Nature 1976 Apr 8 260 5551 500 7 Maxam AM y Gilbert W 1977 A new method for sequencing DNA Proc Natl Acad Sci U S A 2 74 PMID 265521 Sanger F y Coulson AR 1975 J Mol Biol 94 441 448 Unknown Nature 1986 Jun 12 18 321 6071 674 9 Fluorescence detection in automated DNA sequence analysis Nucleic Acids Res 1985 Apr 11 13 7 2399 412 The synthesis of oligonucleotides containing an aliphatic amino group at the 5 terminus synthesis of fluorescent DNA primers for use in DNA sequence analysis Fast Chromatogram Viewer 3730xl DNA Analyzer a b Reeve MA Fuller CW 31 de agosto de 1995 A novel thermostable polymerase for DNA sequencing Nature 376 6543 796 797 PMID 7651542 fechaacceso requiere url ayuda International Human Genome Sequencing Consortium 2004 Finishing the euchromatic sequence of the human genome Nature 431 7011 931 45 PMID 15496913 paper available online Informacion del proyecto genoma humano Archivado desde el original el 15 de marzo de 2008 Consultado el 2 de abril de 2008 Neil Hall 2007 Advanced sequencing technologies and their wider impact in microbiology The Journal of Experimental Biology 209 1518 1525 G M Church 2006 Genomes for ALL Scientific Am 294 1 47 54 PMID 16468433 Telenti A et al 2016 Deep sequencing of 10 000 human genomes Proceedings of the National Academy of Sciences 201613365 a b M Margulies et al 2005 Genome sequencing in microfabricated high density picolitre reactors Nature 437 376 380 a b J Shendure G J Porreca N B Reppas X Lin J Pe McCutcheon A M Rosenbaum M D Wang K Zhang R D Mitra and G M Church Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome Science 309 5741 1728 1732 a b Copia archivada Archivado desde el original el 16 de mayo de 2008 Consultado el 16 de mayo de 2008 Applied Biosystems SOLiD technology Braslavsky I Hebert H Kartalov E and Quake S R 2003 Sequence information can be obtained from single DNA molecules Proceedings of the National Academy of Sciences of the United States of America 100 3960 3964 Texto completo disponible online M Ronaghi S Karamohamed B Pettersson M Uhlen P Nyren 1996 Real time DNA sequencing using detection of pyrophosphate release Analytical Biochemistry 242 84 89 S C Macevicz US Patent 5750341 filed 1995 G J Hanna V A Johnson D R Kuritzkes D D Richman J Martinez Picado L Sutton J D Hazelwood R T D Aquila 2000 Comparison of sequencing by hybridization and cycle sequencing for genotyping of human immunodeficiency virus type 1 reverse transcriptase Journal of Clinical Microbiology 38 7 2715 PMID 10878069 Texto 2721 ignorado ayuda J R Edwards H Ruparel J Ju 2005 Mass spectrometry DNA sequencing Mutation Research 573 1 2 3 12 VisiGen Biotechnologies Inc Archivado desde el original el 7 de septiembre de 2008 Consultado el 5 de abril de 2008 Grupo de Harvard de Nanoporos Archivado el 21 de febrero de 2002 en Wayback Machine Aplicacion 20060029957 de USPTO asignado a ZS genetics http www freepatentsonline com 20060029957 html NHGRI pretende efectuar secuenciaciones de ADN mas rapidas y baratas NIH News Release 4 October 2006 Panorama del Premio Premio Arconte X de Genomica A new method for sequencing DNA Barry L Karger A Guttman A S Cohen D N Heiger 15 de enero de 1990 Analytical and micropreparative ultrahigh resolution of oligonucleotides by polyacrylamide gel high performance capillary electrophoresis Analytical Chemistry 62 2 137 141 doi 10 1021 ac00201a010 La referencia utiliza el parametro obsoleto coautores ayuda fechaacceso requiere url ayuda Lloyd M Smith Luckey JA Drossman H Kostichka AJ Mead DA D Cunha J Norris TB 11 de agosto de 1990 High speed DNA sequencing by capillary electrophoresis Nucleic Acids Research 18 4417 4421 PMID 2388826 doi 10 1093 nar 18 15 4417 Consultado el 8 de octubre de 2007 La referencia utiliza el parametro obsoleto coautores ayuda Norman J Dovichi H P Swerdlow S Wu H R Harke 7 de septiembre de 1990 Capillary gel electrophoresis for DNA sequencing laser induced fluorescence detection with the sheath flow cuvette Journal of Chromatography 516 61 67 PMID 2286629 La referencia utiliza el parametro obsoleto coautores ayuda fechaacceso requiere url ayuda DC Page Foote S Vollrath D Hilton A 2 de octubre de 1992 The human Y chromosome overlapping DNA clones spanning the euchromatic region Science 258 5079 60 66 PMID 1359640 fechaacceso requiere url ayuda Daniel Cohen Ilya Chumakov Philippe Rigault Sophie Guillou Pierre Ougen Alain Billaut Ghislaine Guasconi Patricia Gervy Isabelle LeGall Pascal Soularue Laurent Grinas Lydie Bougueleret Christine Bellanne Chantelot Bruno Lacroix Emmanuel Barillot Philippe Gesnouin Stuart Pook Guy Vaysseix Gerard Frelat Annette Schmitz Jean Luc Sambucy Assumpcio Bosch Xavier Estivill Jean Weissenbach Alain Vignal Harold Riethman David Cox David Patterson Kathleen Gardiner Masahira Hattori Yoshiyuki Sakaki Hitoshi Ichikawa Misao Ohki Denis Le Paslier Roland Heilig Stylianos Antonarakis 1 de octubre de 1992 Continuum of overlapping clones spanning the entire human chromosome 21q Nature 359 6394 380 387 PMID 1406950 doi 10 1038 359380a0 La referencia utiliza el parametro obsoleto coautores ayuda fechaacceso requiere url ayuda E S Lander Dietrich W Katz H Lincoln SE Shin HS Friedman J Dracopoli NC 1992 06 A Genetic Map of the Mouse Suitable for Typing Intraspecific Crosses Genetics 131 423 447 PMID 1353738 Consultado el 8 de octubre de 2007 Jean Weissenbach Gyapay G Dib C Vignal A Morissette J Millasseau P Vaysseix G Lathrop M 29 de octubre de 1992 A second generation linkage map of the human genome Nature 359 794 801 PMID 1436057 doi 10 1038 359794a0 fechaacceso requiere url ayuda R A Mathies Ju J Ruan C Fuller CW Glazer AN 9 de mayo de 1995 Fluorescence Energy Transfer Dye Labeled Primers for DNA Sequencing and Analysis PNAS 92 4347 4351 PMID 7753809 Consultado el 8 de octubre de 2007 Frederick R Blattner Guy Plunkett III Craig A Bloch Nicole T Perna Valerie Burland Monica Riley Julio Collado Vides Jeremy D Glasner Christopher K Rode George F Mayhew Jason Gregor Nelson Wayne Davis Heather A Kirkpatrick Michael A Goeden Debra J Rose Bob Mau Ying Shao 5 de septiembre de 1997 The Complete Genome Sequence of Escherichia coli K 12 Science 277 5331 1453 1462 PMID 9278503 doi 10 1126 science 277 5331 1453 fechaacceso requiere url ayuda Phil Green Brent Ewing 1998 03 Base calling of automated sequencer traces using phred II Error probabilities Genome Reserarch 8 3 186 94 PMID 9521922 fechaacceso requiere url ayuda The C elegans Sequencing Consortium 11 de diciembre de 1998 Genome Sequence of the Nematode C elegans A Platform for Investigating Biology Science 282 5396 2012 2018 PMID 9851916 doi 10 1126 science 282 5396 2012 10 1126 science 282 5396 2012 fechaacceso requiere url ayuda Dunham I Shimizu N Roe BA Chissoe S Hunt AR Collins JE Bruskiewich R Beare DM Clamp M Smink LJ Ainscough R Almeida JP Babbage A Bagguley C Bailey J Barlow K Bates KN Beasley O Bird CP Blakey S Bridgeman AM Buck D Burgess J Burrill WD O Brien KP et al 2 de diciembre de 1999 The DNA sequence of human chromosome 22 Nature 402 6761 489 495 PMID 10591208 fechaacceso requiere url ayuda Hattori M A Fujiyama T D Taylor H Watanabe T Yada H S Park A Toyoda K Ishii Y Totoki D K Choi E Soeda M Ohki T Takagi Y Sakaki S Taudienk K Blechschmidtk A Polleyk U Menzelk J Delabar K Kumpfk R Lehmannk D Patterson K Reichwaldk A Rumpk M Schillhabelk A Schudyk W Zimmermannk A Rosenthalk J KudohI K ShibuyaI K KawasakiI S AsakawaI A ShintaniI T SasakiI K NagamineI S MitsuyamaI S E Antonarakis S MinoshimaI N ShimizuI G Nordsiek K Hornischer P Brandt M Scharfe O SchoEn A Desario J Reichelt G Kauer H Bloecker J Ramser A Beck S Klages S Hennig L Riesselmann E Dagand T Haaf S Wehrmeyer K Borzym K Gardiner D Nizetickk F Francis H Lehrach R Reinhardt and M L Yaspo 2000 The DNA sequence of human chromosome 21 Nature 405 311 319 Initial sequencing and analysis of the human genome Nature 409 6822 860 921 15 de febrero de 2001 PMID 11237011 fechaacceso requiere url ayuda J C Venter et al 16 de febrero de 2001 The sequence of the human genome Science 291 5507 1304 51 PMID 11181995 doi 10 1126 science 1058040 fechaacceso requiere url ayuda Levy S Sutton G Ng PC Feuk L Halpern AL et al 2007 The Diploid Genome Sequence of an Individual Human PLoS Biol 5 10 e254 doi 10 1371 journal pbio 0050254 Ansorge W J 2009 Next generation DNA sequencing techniques New Biotechnology 25 4 Diggle M A 2004 Pyrosequencing Molecular Biotechnology 28 Franca L T C 2002 A review of DNA sequencing techniques Quarterly Reviews of Biophysics 35 2 Hutchinson C A 2007 sequencing bench to bedside and beyond Nucleic Acids Research 35 18 Enlaces externos EditarTecnologia basica para el marcaje del ADN con atomos pesados para imagenes directas usando la microscopia electronica de transmision y la secuenciacion de cadenas de mas de 10 000 pares de bases por imagen capturada Tecnologia de marcaje con numero Z alto Plataforma de secuenciacion de ADN Millegen Secuenciacion de ADN Animacion de una reaccion por terminador marcado por tincion Datos Q380546 Multimedia DNA sequencing Obtenido de https es wikipedia org w index php title Secuenciacion del ADN amp oldid 139824444, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos