My ChIP-Seq(4): análisis diferencial de MAnorm
Jaja, busqué en Internet y no pude encontrar ningún tutorial o instrucción en chino sobre MAnorm. Este artículo será el primero ~ ¿Difundir flores?ヽ(°▽°)ノ? Luego tienes que escribir con cuidado y sentir el pear.jpg==
En primer lugar, ¿qué es MAnorm y qué puede hacer?
En pocas palabras, este es un software que encuentra picos diferenciales entre dos muestras de ChIP-Seq. En el proceso general de ChIP, si se trata de una línea celular de un solo procesamiento, después de llamar al pico, podemos realizar un análisis del motivo de unión o un análisis funcional de los genes relacionados con el pico, pero si se trata de líneas celulares de dos procesamientos (como la inanición; ) grupo y grupo de control), definitivamente queremos saber la diferencia en las modificaciones de histonas entre los dos tratamientos, similar al análisis de genes expresados diferencialmente en RNA-Seq, por lo que esta es una buena manera de descubrir la diferencia entre dos ChIP- Muestras de secuencias. MAnorm permite este análisis.
En términos generales, el análisis de diferencias anterior no es necesario realizarlo en el nivel máximo, sino que también se puede realizar en el nivel de lectura. Esto se denomina "método de un solo paso"; valor y luego comparar el valor máximo La densidad o la profundidad se denomina "método de dos pasos". "Método de dos pasos". Hay diferentes tipos de software disponibles para diferentes métodos, y aquí es donde madura el análisis de ChIP, pero el flujo de tecnología se puede programar y personalizar para sus propios fines, por lo que no entraremos en eso por ahora.
Entonces, ¿cómo elegir un software de análisis diferencial? Según el tipo de modificación de histonas, si la muestra tiene duplicados y si se requiere un pico de llamada (es decir, un conjunto de regiones predefinido), la siguiente figura es clara:
Mi muestra tiene dos tipos de modificaciones: picos amplios y picos estrechos, y No hay duplicación. El tiempo de mi proyecto es escaso y quiero utilizar un software para implementarlo, así que elegí MAnorm.
Sin más, veamos las imágenes.
Versión 1.1.4:
conda/PyPi
Cabe señalar que esta versión solo admite el formato de cama y no admite el modo peer. modo Trate todas las lecturas como lecturas de un solo extremo. Si desea utilizar más formatos (sam/bam/bedpe, etc.) para leer archivos, utilice v1.2.0.
Versión 1.2.0:
Actualmente, solo puedes instalarlo copiando el código fuente de Github. Método:
Se recomienda leer primero las instrucciones, preferiblemente de manorm --help of linux, o buscar las instrucciones adjuntas de la versión correspondiente en Github. Esto es muy importante, porque a veces las instrucciones se encuentran en. Internet son diferentes a las suyas. Las versiones reales utilizadas son inconsistentes y pueden tomar desvíos. No me pregunten cómo lo sé.
Por lo tanto, es necesario preparar 4 archivos:
Mueva los archivos anteriores a una nueva carpeta. ***Consejo: El grupo de control ya no es necesario en el archivo
Comandos básicos (--p1 --p2 --r1 --r2 -o son 5 parámetros requeridos, tenga en cuenta que hay dos - ):
Se recomienda intentar ejecutar un conjunto de datos primero y ajustar el formato de acuerdo con el archivo de error. El software es inmaduro y requiere más formato.
Después de ejecutarlo durante unos 10 minutos, se generaron cuatro archivos de resultados:
sample1peaks_vs_sample2peaks_all_MAvalues.xls: este es el archivo de resultados principal, en formato Excel, y el grupo_pico que contiene está marcado como común. /1único/2único. Carpeta Output_filters: 3 archivos peaks.bed, que pueden ser el resultado de condiciones ligeramente más estrictas. Dos archivos sesgados contienen pocos picos y un archivo imparcial contiene muchos picos. No hay mucha diferencia entre los archivos.
carpeta output_tracks: 3 archivos peluca, valores M A, tipo de archivo de visualización UCSC.
En resumen, decidimos utilizar el archivo de salida principal, que es el primer resultado, para análisis posteriores.