Red de conocimiento informático - Aprendizaje de código fuente - Análisis del transcriptoma sin referencias: empalme de transcripciones utilizando Trinity (guión de referencia)

Análisis del transcriptoma sin referencias: empalme de transcripciones utilizando Trinity (guión de referencia)

1. Script de referencia:

nohup /home/zxd/software/trinityrnaseq-Trinity-v2.4.0/Trinity --seqType fq --max_memory 4G --CPU 1 --samples_file ./sample.txt - -SS_lib_type RF gt; trinity.log 2gt; trinity.err amp;

2. Los parámetros específicos de la cadena están configurados incorrectamente y todos los resultados son incorrectos

i.

Al construir una biblioteca de transcriptoma, puede elegir una biblioteca específica de una cadena o una biblioteca no específica de una cadena.

Para las bibliotecas de hebras específicas, tenemos una idea clara de si las lecturas resultantes están en la misma dirección que la transcripción o en la dirección opuesta.

Existen varios métodos para construir bibliotecas específicas de cadena, los más utilizados son los métodos basados ​​en dUTP.

Hay dos formas de representar tipos de biblioteca.

El primer método de representación:

El segundo método de representación:

II. Configuración de parámetros

En el análisis de datos, el más El más El error más complejo, más propenso a errores y más grave, además de utilizar la secretaria incorrecta, es obtener parámetros de tipo de biblioteca incorrectos. Los errores de configuración pueden dar lugar a transcripciones demasiado cortas, los niveles de expresión son extremadamente bajos y las tasas de alineación son extremadamente bajas. Al analizar datos, asegúrese de preguntarle al técnico de laboratorio que construyó la biblioteca.

La configuración de parámetros del software de uso común es la siguiente.

1. Software de empalme de transcripciones

Al empalmar transcripciones, se debe considerar la especificidad de la cadena.

1.1 Trinity

La especificidad sin cadena es la predeterminada, no se requiere configuración

Los parámetros específicos de la cadena son: -SS_lib_type, si se usa dUTP, el valor es RF

Gemelos 1.2

No específico de cadena. -Si usa dUTP: -library-type fr-firststrand

2. Software para comparar lecturas con el genoma

2.1 tophat

strandless-library- type fr -unstranded, predeterminado

Si usa dUTP con cadena: -library-type fr-firststrand

2.2 hisat2

Valor predeterminado no específico de cadena, no es necesario configurarlo

Especificidad de cadena Si usa dUTP: -rna-strandness RF, después de agregar este parámetro, cada lectura mostrará una marca XS en el archivo sam, ' ' '-' indica la lectura. ''-' indica la relación entre la transcripción y la secuencia del genoma donde se encuentra la lectura.

2.3 STAR

En la alineación STAR, no es necesario configurar manualmente los parámetros del tipo de biblioteca.

3. Cuantificación de expresiones

El software de cuantificación de expresiones calcula las lecturas en función de los archivos sam comparados y necesita proporcionar información de cadena específica.

3.1 eXpress

Valor predeterminado no específico de cadena, no se requiere configuración

Específico de cadena si se usa dUTP: -rf-stranded

3.2 RSEM

RSEM se configura mediante el parámetro --strandedness?

No varado ninguno

Varado si se usa dUTP: --varado inverso

Referencia: este artículo es de la clase de genética, curso en vídeo de bioinformática

.