Red de conocimiento informático - Consumibles informáticos - Introducción a la secuenciación de alto rendimiento

Introducción a la secuenciación de alto rendimiento

La tecnología de secuenciación de alto rendimiento (High-throughput sequencing), también conocida como tecnología de secuenciación de "próxima generación" (secuenciación "de próxima generación"), puede procesar cientos de miles a millones de moléculas de ADN en paralelo a la vez, la determinación de la secuencia y, en general, las longitudes de lectura cortas son indicadores.

La tecnología de secuenciación de alto rendimiento es un cambio revolucionario con respecto a la secuenciación tradicional. Puede secuenciar de cientos de miles a millones de moléculas de ADN a la vez, por lo que en cierta literatura se la denomina tecnología de secuenciación de próxima generación (siguiente). secuenciación de generación) demuestra sus cambios trascendentales. Al mismo tiempo, la secuenciación de alto rendimiento permite realizar un análisis detallado y completo del transcriptoma y el genoma de una especie, por lo que también se denomina secuenciación profunda.

Historia del desarrollo

Secuenciación de primera generación: mediados de los años 1980

Métodos tradicionales de degradación química, métodos de terminación de cadenas didesoxi y aquellos basados ​​en ellos Las tecnologías de secuenciación desarrolladas son colectivamente llamado secuenciación de primera generación. Ha desempeñado un papel importante en la investigación de biología molecular, como el Proyecto Genoma Humano

Secuenciación de segunda generación: iniciada en 2005

Incluye principalmente tecnología de secuenciación 454 de la empresa Roche 454, Illumina La tecnología de secuenciación Solexa de la empresa y la tecnología de secuenciación Ion Torrent de Life Technologies. La característica más importante de la tecnología de secuenciación de segunda generación es su alto rendimiento, que puede secuenciar de cientos de miles a millones de moléculas de ADN a la vez

Secuenciación de tercera generación: iniciada en 2008

La tercera generación de tecnología de secuenciación de ADN se caracteriza por la secuenciación de una sola molécula, como el secuenciador de una sola molécula de Helico BioScience, así como la tecnología de secuenciación de ADN de una sola molécula en tiempo real de Pacific Biosciences y el nanoporo de Oxford Nanopore Technology que son en desarrollo Tecnología de secuenciación de una sola molécula, etc.

Actualmente, la secuenciación de alto rendimiento comúnmente se refiere al uso de tecnología de secuenciación de segunda generación para la secuenciación.

Tecnología de secuenciación de tercera generación (una sola molécula) -secuenciación de moléculas), la longitud de lectura es mayor, la tasa de error es mayor y el costo es mayor.

Comparación de plataformas de prueba NGS

Explicación de términos comunes

Lecturas: las etiquetas de secuencia generadas por las plataformas de secuenciación de alto rendimiento se denominan lecturas

Ref: Secuencia del genoma de referencia

Profundidad de secuenciación: relación entre el número total de bases obtenidas mediante la secuenciación y el tamaño del genoma a probar.

Cobertura: proporción de secuencias obtenidas mediante secuenciación con respecto al genoma completo.

SNP: Variación de sitio de un solo nucleótido

Polimorfismo causado por una variación de un solo nucleótido (sustitución, inserción o deleción) en la misma posición en la secuencia de ADN genómico entre individuos. Existen diferencias en nucleótidos individuales en la misma posición en las secuencias de ADN del genoma de diferentes especies e individuos. En promedio, puede ocurrir un solo polimorfismo de nucleótido (SNP) por cada 1.000 nucleótidos en el genoma humano. Algunos de estos SNP pueden estar relacionados con enfermedades, pero la mayoría pueden no estar relacionados con enfermedades. El SNP es una base importante para estudiar la variación genética en familias humanas y cepas de animales y plantas.

SNV:

Al estudiar los genomas tumorales, en comparación con el tejido normal, la variación específica de un solo nucleótido en los tumores es una mutación somática, llamada SNV (variantes de un solo nucleótido)

INDEL:

Inserción (INsertion) o eliminación (DELetion) de un pequeño fragmento de genoma (<50pb)

CNV (Copy Number Variation, CNV): variación de datos de copia

Un componente importante de la variación estructural genética (StructuralVariant, SV), causado por reordenamientos del genoma, generalmente se refiere al aumento en el número de copias de grandes fragmentos del genoma con una longitud de más de 1 kb (ganancia) o disminución (pérdida). Como se muestra en la figura, A es pérdida y B es ganancia.

SV (estructura variación): Variación estructural

Se refiere a la gran variación de segmentos que se produce en el cromosoma. Incluye principalmente la inserción y eliminación de grandes segmentos de cromosomas (como se muestra en la figura a), la aparición de inversión y transversión en una determinada región dentro del cromosoma (como se muestra en la figura d, e) y la recombinación entre dos cromosomas ( como se muestra en la figura f). Aunque el número de SV es mucho menor que el de SNV y los indeles, los SV afectan a más bases. La literatura muestra que hasta el 13% de las bases se ven afectadas por los cambios de SV. Los SV están altamente asociados con el riesgo de enfermedad y la variación fenotípica.