Método de aleatorización mendeliana
Escrito antes: Cuanto más leemos, más conocimiento adquirimos. Los humanos inteligentes siempre pueden idear varias formas de encontrar diversas conexiones entre todas las cosas del mundo. Leí sobre el método de aleatorización mendeliana y un análisis de sensibilidad de Egger de aleatorización mendeliana. Estaba realmente preocupado. Verifiqué la información y tomé notas. La base de esta nota proviene de un documento chino, "Aplicación del método de aleatorización mendeliana en inferencia causal".
El diseño de investigación de Aleatorización Mendeliana (MR) sigue la ley de herencia mendeliana de "los alelos parentales se asignan aleatoriamente a la descendencia". Si el genotipo determina el fenotipo, el genotipo pasará por el fenotipo ya que existe una asociación. en el caso de la enfermedad, el genotipo se puede utilizar como variable instrumental para inferir la asociación entre el fenotipo y la enfermedad. Correlación zy=correlación zx×correlación xy, ver figura.
Groenlandia profundizó en la aplicación de variables instrumentales en el control de factores de confusión epidemiológicos:
①La variable instrumental z no tiene correlación con el factor de confusión u
; ②La variable instrumental z está relacionada con el factor de exposición x;
③La variable instrumental z no está relacionada con la variable de resultado Y, y z solo puede relacionarse con Y a través de la variable X.
El uso de la ecuación anterior debe cumplir las condiciones:
① La asociación entre las variables x e Y definitivamente se verá afectada por el potencial factor de confusión U, pero la variable instrumental z es relacionado con las variables x y z No existe ningún factor de confusión potencial entre ella y la variable Y;
②La asociación entre la variable x y el resultado Y no se puede observar directamente porque la variable x es una correlación directa conocida o mensurable y existe independientemente de otros factores.
Estas restricciones sobre las variables instrumentales también hacen que la selección correcta de variables instrumentales apropiadas sea una dificultad en la investigación de correlaciones.
①MR de una etapa (MR de una etapa):
②MR de muestra independiente (MR de una muestra): este método utiliza una única muestra de investigación y utiliza regresión de mínimos cuadrados de 2 etapas El modelo (regresión de mínimos cuadrados en 2 etapas, 2SLS) estima cuantitativamente el tamaño del efecto de asociación entre los factores de exposición x e Y. El primer paso: construir un modelo de regresión G-X para obtener el valor predicho (P) del factor de exposición. El segundo paso: construir un modelo de regresión P-Y, es decir, obtener la regresión entre el valor predicho P del factor de exposición y el resultado; ecuación variable Y.
Dado que este método se limita a una única muestra, el grado de certeza es pequeño y la selección de variables instrumentales también es relativamente limitada, lo que se ve fácilmente afectado por posibles factores de confusión. El método de análisis 2SLS se puede implementar utilizando "ivregress" (StataCorp) en el software Stata y "ivpack" (R Foundation) en el software R.
③MR de dos muestras (MR de dos muestras): La estrategia de diseño de MR de dos muestras se basa en la correlación entre G-X y G-Y. La población de investigación proviene de dos muestras independientes de la misma población (tales. como GWAS y exposición, GWAS y datos de asociación de resultados n9) requiere que las dos muestras tengan características de distribución racial, de género y de edad similares. Debido a que el tamaño de la muestra es mayor, este método puede lograr una mayor confianza. Actualmente, la RM de dos muestras se utiliza ampliamente debido a los datos públicos de una gran cantidad de grupos de cooperación GWAS en todo el mundo.
④ MR bidireccional (MR bidireccional): también conocido como MR recíproco (MR recíproco)
Este método será de gran utilidad para resolver el problema de la dirección de la red causal, pero al analizar dos variables con efectos biológicos desconocidos, es necesario evitar dejarse engañar por los resultados de la RM bidireccional.
⑤MR de dos pasos (MR de dos pasos): a diferencia de la RM de dos muestras, la RM de dos pasos necesita utilizar variables instrumentales genéticas para evaluar la posible variable intermedia M (Mediación) de asociación causal para explorar el medio ambiente Si el factor de exposición (E) conduce a cambios en la enfermedad (O) a través de indicadores epigenéticos (M), ver la figura
En la primera etapa, la variable genética instrumental G1 es independiente del factor de confusión factores, refiriéndose a la relación entre el factor de exposición E y La correlación entre el resultado O y el resultado O debe realizarse a través de la variable intermedia M;
En la segunda etapa, otra variable instrumental genética independiente G2 es se utiliza como herramienta de referencia de la variable intermedia M para analizar la relación entre la variable intermedia M y el resultado 0 Relaciones
Por ejemplo, el IMC afecta indirectamente la aparición de enfermedad coronaria a través de la presión arterial. Actualmente, este método se ha aplicado a la investigación de epidemiología epigenética. Binder y Michels utilizaron MTHFR C677T y A1298C maternos como variables instrumentales y descubrieron que 7 posiciones CpG están involucradas en la relación entre el folato de los glóbulos rojos y las conexiones de metilación. Dekkers et al. 63 utilizaron datos de metilación de todo el genoma y descubrieron que los resultados de metilación diferencial en las células inmunes fueron causados por cambios en los niveles de lípidos en sangre (TG, LDL-C, HDL-C) dentro de los individuos, pero no al revés. Este método debe satisfacer el supuesto de que la correlación entre E-M y E-O es lineal y homogénea, y se ha ampliado hasta convertirse en la base para analizar relaciones causales complejas de redes, como el diseño de redes MR (Network MR).
⑥ Interacciones de exposición genética MR (Interacciones de exposición genética): el diseño de investigación de RM también se puede utilizar para explorar el fenómeno de interacción de los factores de exposición genética en la aparición de enfermedades y también requiere la identificación de genes. y los resultados. La asociación debe depender del estado del factor de exposición. Este método puede distinguir entre genes que actúan directamente sobre el resultado y genes que actúan sobre el resultado a través de factores de exposición.
1. Análisis de sensibilidad
2. Análisis de regresión MR-Egger: utilice el análisis de regresión MR-Egger para evaluar el sesgo causado por la pleiotropía genética. La pendiente de la línea de regresión MR-Egger puede estimar el tamaño de la pleiotropía direccional.
Efecto Beavis: los estudios de resonancia magnética basados en datos de GWAS pueden sobreestimar la asociación entre la genética y la exposición, también conocida como "la maldición del ganador"
/s/OkuUFZWGbkDj2yify5ULQA
Este artículo tiene ejemplos y aplicaciones prácticas, lo cual es bueno: /p/253309a571aa
Se dice que es un modelo mejor que la aleatorización mendeliana y evita falsos positivos. Puedes ver Ver