Análisis del transcriptoma sin referencias: empalme de transcripciones utilizando Trinity (guión de referencia)
nohup /home/zxd/software/trinityrnaseq-Trinity-v2.4.0/Trinity --seqType fq --max_memory 4G --CPU 1 --samples_file ./sample.txt - -SS_lib_type RF gt; trinity.log 2gt; trinity.err amp;
2. Los parámetros específicos de la cadena están configurados incorrectamente y todos los resultados son incorrectos
i.
Al construir una biblioteca de transcriptoma, puede elegir una biblioteca específica de una cadena o una biblioteca no específica de una cadena.
Para las bibliotecas de hebras específicas, tenemos una idea clara de si las lecturas resultantes están en la misma dirección que la transcripción o en la dirección opuesta.
Existen varios métodos para construir bibliotecas específicas de cadena, los más utilizados son los métodos basados en dUTP.
Hay dos formas de representar tipos de biblioteca.
El primer método de representación:
El segundo método de representación:
II. Configuración de parámetros
En el análisis de datos, el más El más El error más complejo, más propenso a errores y más grave, además de utilizar la secretaria incorrecta, es obtener parámetros de tipo de biblioteca incorrectos. Los errores de configuración pueden dar lugar a transcripciones demasiado cortas, los niveles de expresión son extremadamente bajos y las tasas de alineación son extremadamente bajas. Al analizar datos, asegúrese de preguntarle al técnico de laboratorio que construyó la biblioteca.
La configuración de parámetros del software de uso común es la siguiente.
1. Software de empalme de transcripciones
Al empalmar transcripciones, se debe considerar la especificidad de la cadena.
1.1 Trinity
La especificidad sin cadena es la predeterminada, no se requiere configuración
Los parámetros específicos de la cadena son: -SS_lib_type, si se usa dUTP, el valor es RF
Gemelos 1.2
No específico de cadena. -Si usa dUTP: -library-type fr-firststrand
2. Software para comparar lecturas con el genoma
2.1 tophat
strandless-library- type fr -unstranded, predeterminado
Si usa dUTP con cadena: -library-type fr-firststrand
2.2 hisat2
Valor predeterminado no específico de cadena, no es necesario configurarlo
Especificidad de cadena Si usa dUTP: -rna-strandness RF, después de agregar este parámetro, cada lectura mostrará una marca XS en el archivo sam, ' ' '-' indica la lectura. ''-' indica la relación entre la transcripción y la secuencia del genoma donde se encuentra la lectura.
2.3 STAR
En la alineación STAR, no es necesario configurar manualmente los parámetros del tipo de biblioteca.
3. Cuantificación de expresiones
El software de cuantificación de expresiones calcula las lecturas en función de los archivos sam comparados y necesita proporcionar información de cadena específica.
3.1 eXpress
Valor predeterminado no específico de cadena, no se requiere configuración
Específico de cadena si se usa dUTP: -rf-stranded
3.2 RSEM
RSEM se configura mediante el parámetro --strandedness?
No varado ninguno
Varado si se usa dUTP: --varado inverso
Referencia: este artículo es de la clase de genética, curso en vídeo de bioinformática
.