Red de conocimiento informático - Problemas con los teléfonos móviles - Tutorial oficial de Seurat(v4) | Introducción a la integración de scRNA-seq

Tutorial oficial de Seurat(v4) | Introducción a la integración de scRNA-seq

Fuente: vignettes/integration_introduction.Rmd

El análisis conjunto de dos o más conjuntos de datos unicelulares presenta un desafío único. En particular, identificar poblaciones de células presentes en múltiples conjuntos de datos puede resultar problemático en los flujos de trabajo estándar. Seurat v4 incluye un conjunto de métodos para hacer coincidir (o "alinear") poblaciones de células compartidas entre conjuntos de datos. Estos métodos primero identifican células en conjuntos de datos ("anclas") en estados biológicos coincidentes, que pueden usarse para corregir diferencias técnicas entre conjuntos de datos (es decir, corrección del efecto por lotes) y realizar análisis comparativos de scRNA-seq en diferentes condiciones experimentales.

A continuación, realizamos un análisis comparativo utilizando células PBMC humanas en dos estados diferentes (estado de reposo o estimulado por interferón). Para conocer métodos detallados, consulte: Stuart, Butler et al: Stuart, Butler et al, 2019

Objetivos de integración:

En el siguiente tutorial, utilizará el integrador Seurat para delinear complejos células Análisis comparativo de tipos.

Para mayor comodidad, encapsulamos los datos utilizados esta vez en el paquete SeuratData.

Carga los datos, luego crea el objeto

La función FindIntegrationAnchors() usa una lista de objetos Seurat como entrada para identificar los anclajes, y luego usa la función IntegrateData() para combinar el conjunto de datos con los anclajes identificados para integrar.

Ahora podemos realizar un análisis completo de todas las celdas

Visualización

Puedes usar split.by para mostrar gráficos UMAP para ambas condiciones

Para identificar marcadores de tipo celular conservados clásicos en diferentes condiciones, utilice la función FindConservedMarkers(). Esta función analiza la expresión diferencial para cada grupo/conjunto de datos y luego fusiona los valores p usando MetaDE.

A continuación, identificaremos marcadores conservados para el grupo 6 (células NK).

Podemos explorar estos genes y luego ayudarnos a anotar tipos de células.

El parámetro split.by de la función DotPlot() le permite ver marcadores de tipos de células conservados en todas las condiciones, mostrando los niveles de expresión y el porcentaje de células de la población que expresan un gen determinado. Aquí, mapeamos 2-3 genes marcadores fuertes para cada uno de los 13 grupos.

Ahora que tenemos las células estimuladas y de control alineadas, podemos comenzar un análisis comparativo para ver las diferencias provocadas por la estimulación. Una forma de observar aproximadamente estos cambios es trazar la expresión promedio de las células estimuladas y de control y buscar genes visualmente anormales en un diagrama de dispersión. Aquí, utilizamos niveles de expresión promedio en poblaciones de monocitos CD14 y células T vírgenes estimuladas y de control para crear diagramas de dispersión que resaltan los genes que respondieron significativamente a la estimulación con interferón.

La figura anterior también muestra genes que el autor sabía de antemano que se expresaban diferencialmente bajo las dos condiciones: genes.to.label = c("ISG15", "LY6E", "IFI6", "ISG20 ", "MX1", "IFIT2", "IFIT1", "CXCL10", "CCL8"), en nuestro caso necesitamos utilizar otro método para obtener estos genes.

Como puede ver, muchos de los mismos genes están regulados positivamente en ambos tipos de células, lo que puede representar vías de respuesta al interferón conservadas.

Como confiamos en identificar el mismo tipo de célula en diferentes condiciones, podemos preguntar qué genes cambian en diferentes condiciones en el mismo tipo de célula.

Otra forma de mostrar cambios en la expresión genética es utilizar FeaturePlot() o VlnPlot() con el parámetro split.by.

Por ejemplo, CD3D y GNLY son marcadores muy clásicos de células T y células T NK/CD8, que no se ven afectadas por la estimulación y muestran patrones de expresión similares en STRIM y CTRL.

Por otro lado, los genes IFI6 e ISG15, que son genes centrales para la respuesta al interferón, estaban regulados positivamente en todas las células.

Finalmente, CD14 y CXCL10 exhiben diferencias específicas del tipo de célula en las respuestas al interferón. En los monocitos CD14, la estimulación con interferón reduce su expresión, lo que puede dar lugar a una clasificación errónea en un marco de análisis supervisado, lo que subraya el valor de un análisis exhaustivo.

Después de la estimulación con interferón, CXCL10 se reguló significativamente en monocitos y células B, pero no en otros tipos de células.

En Hafemeister y Satija, 2019, introdujimos un método mejorado de normalización de scRNA-seq, sctransform. El método se basa principalmente en una regresión binomial negativa regularizada, que evita algunos de los problemas de los flujos de trabajo de normalización estándar, incluida la adición de pseudocuentas y transformaciones logarítmicas.

Para más detalles, consulte: el manuscrito o nuestra subsección SCTransform.

Veamos cómo modificar el flujo de trabajo de integración de Seurat utilizando el método de normalización sctransform, con algunas diferencias clave:

Entonces, el flujo de trabajo completo es el siguiente:

Ahora que los datos han sido integrados, se puede continuar con los pasos de análisis anteriores, como la identificación de células.