fbpx
Wikipedia

Estadístico N50

En bioinformática se define al estadístico N50 como una medida de la longitud media de un conjunto de secuencias nucleotídicas, con mayor peso dado a secuencias más largas. Es ampliamente utilizado en el ensamblado o montaje de un genoma, especialmente en referencia a la longitud de los contig dentro de un proyecto de ensamblado de un genoma.

N50 es definido como la longitud de los contigs tal que usando contigs de igual o mayor tamaño produce la mitad de las bases del genoma. El tamaño N50 se calcula ordenando todos los contigs de mayor a menor, y determinando el conjunto mínimo de contigs cuyo tamaño total sea el 50% de todo el genoma.

Cálculo

Definición matemática: Dado un conjunto de secuencias de longitud variable, la longitud N50 se define como la longitud N por la cual el 50% de todas las bases en las secuencias están en una secuencia de longitud L < N. Esto se puede encontrar matemáticamente de la siguiente manera: Tome una lista L de enteros positivos. Cree otra lista L', que es idéntica a L, excepto que cada elemento n en L se ha sustituido con n copias de sí mismo. Luego, la mediana de L' es el N50 de L. Por ejemplo: si L = {2, 2, 2, 3, 3, 4, 8, 8}, entonces L' consta de seis dos, seis tres, cuatro cuatros, y dieciséis de ochos, el N50 de la L es la mediana de L', que es 6.

Referencias

  • at Broad Institute
  • "Assembly algorithms for next-generation sequencing data", Miller JR, Koren S, Sutton G

Enlaces externos

  •   Datos: Q8842998

estadístico, bioinformática, define, estadístico, como, medida, longitud, media, conjunto, secuencias, nucleotídicas, mayor, peso, dado, secuencias, más, largas, ampliamente, utilizado, ensamblado, montaje, genoma, especialmente, referencia, longitud, contig, . En bioinformatica se define al estadistico N50 como una medida de la longitud media de un conjunto de secuencias nucleotidicas con mayor peso dado a secuencias mas largas Es ampliamente utilizado en el ensamblado o montaje de un genoma especialmente en referencia a la longitud de los contig dentro de un proyecto de ensamblado de un genoma N50 es definido como la longitud de los contigs tal que usando contigs de igual o mayor tamano produce la mitad de las bases del genoma El tamano N50 se calcula ordenando todos los contigs de mayor a menor y determinando el conjunto minimo de contigs cuyo tamano total sea el 50 de todo el genoma Calculo EditarDefinicion matematica Dado un conjunto de secuencias de longitud variable la longitud N50 se define como la longitud N por la cual el 50 de todas las bases en las secuencias estan en una secuencia de longitud L lt N Esto se puede encontrar matematicamente de la siguiente manera Tome una lista L de enteros positivos Cree otra lista L que es identica a L excepto que cada elemento n en L se ha sustituido con n copias de si mismo Luego la mediana de L es el N50 de L Por ejemplo si L 2 2 2 3 3 4 8 8 entonces L consta de seis dos seis tres cuatro cuatros y dieciseis de ochos el N50 de la L es la mediana de L que es 6 Referencias EditarArachne wiki at Broad Institute Assembly algorithms for next generation sequencing data Miller JR Koren S Sutton GEnlaces externos EditarEsta obra contiene una traduccion derivada de N50 statistic de Wikipedia en ingles publicada por sus editores bajo la Licencia de documentacion libre de GNU y la Licencia Creative Commons Atribucion CompartirIgual 3 0 Unported Datos Q8842998 Obtenido de https es wikipedia org w index php title Estadistico N50 amp oldid 118039416, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos