Red de conocimiento informático - Computadora portátil - Descripción general de los métodos de investigación proteómica 2019-112 Notas de la conferencia (Parte 1)

Descripción general de los métodos de investigación proteómica 2019-112 Notas de la conferencia (Parte 1)

Escrito al frente

A finales de octubre, comenzó oficialmente la clase en línea de aprendizaje de proteomas organizada por Crick College y Kang Yusheng. El curso completo consta de 21 lecciones. Como niña con proteína blanca pura, también planeo aprovechar esta oportunidad para aprenderla y experimentarla. Las siguientes son mis primeras notas de la conferencia "Descripción general de los métodos de investigación histológica de proteínas", compartidas con todos los que también quieran comenzar ~

Profesor

El profesor de este curso es muy talentoso Joven: Doctor en la Universidad Técnica de Múnich en 2014. T München), Instituto de Bioanálisis e Histología de Proteínas, bajo la supervisión del Profesor Daniel Bernhard Kuster. La dirección principal es la aplicación de la proteómica basada en espectrometría de masas en tándem en la investigación de fármacos contra el cáncer. Ella es la Dra. Cushing, investigadora asistente que actualmente trabaja en el Instituto de Biomedicina de Sistemas de la Universidad Jiao Tong de Shanghai (¡se deben dar aplausos aquí)! Los intereses de investigación actuales del Dr. Ku están en el descubrimiento de biomarcadores relacionados con tumores y modificaciones de la glicosilación de proteínas.

(Todas las imágenes de este artículo son de las notas de clase del Dr. Ku Xin, publicadas con autorización).

Proteómica basada en espectrometría de masas

Como todos sabemos , el proteoma de las proteínas La ciencia es el estudio de todas las proteínas expresadas por una célula o un organismo. Aunque la secuenciación del genoma es un desastre ahora, no debemos ignorar que las proteínas son las unidades básicas para realizar funciones vitales. ¡Las proteínas realizan diversas funciones biológicas formando diversos compuestos y formando redes de vías! Por lo tanto, hay muchos problemas biológicos que sólo pueden estudiarse y explorarse a nivel proteico, pero que también deben estudiarse a nivel sistémico, como las interacciones proteína-proteína, la localización celular de proteínas, las modificaciones postraduccionales, las vías de señalización y la regulación de las vías metabólicas y la funcionalidad. ¡Por eso la proteómica es tan importante!

Dado que es importante, ¡los científicos naturalmente hacen todo lo posible para estudiarlo! La primera tecnología utilizada fue la legendaria electroforesis en gel bidimensional (2-DE). Tanto el rendimiento como la precisión fueron insatisfactorios debido a diversos problemas, como la baja resolución y la superposición de proteínas. Tras el auge de la tecnología de espectrometría de masas, fue rápidamente reemplazada.

Hablando del nacimiento de la espectrometría de masas, supongo que muchos amigos han oído la famosa historia del contraataque de Diao Si. La historia habla del ganador del Premio Nobel de Química en 2002, Kenichi Tanaka, uno de los inventores de la espectrometría de proteínas. Durante el experimento se añadió accidentalmente glicerol y, como resultado, la espectrometría de masas se introdujo mágicamente en el campo de aplicación de la identificación de macromoléculas biológicas. Piénselo, desde toda la historia de la ciencia y la tecnología humanas hasta la vida de cada individuo, hay tantos milagros increíbles ~

Cuando la tecnología de espectrometría de masas y la proteómica se encuentran, en realidad es un rayo el que enciende un fuego. ¡Se produjo una fuerte reacción química que detonó rápidamente el desarrollo de todo el sujeto! En apenas una docena de años, los objetivos de investigación de la proteómica han variado desde modelos celulares y animales hasta muestras humanas, como fluidos y tejidos corporales, y la complejidad biológica de su campo de aplicación se ha vuelto cada vez mayor. El propósito de la investigación ha evolucionado desde la derivación inicial de la secuencia de péptidos hasta el análisis cualitativo y cuantitativo de péptidos y proteínas, modificaciones postraduccionales y ahora la proteómica dirigida, que se ha convertido en un nuevo punto de interés. Considerándolo todo, ¡imparable!

Descripción general de la proteómica basada en espectrometría de masas

Hablando de proteómica dirigida, todos sabemos que los campos de aplicación de la proteómica se han dirigido principalmente a la biología básica, como el estudio de vías, complejos de proteínas , redes de interacción, caracterización de tipos de células y tejidos, observación de la expresión de proteínas durante el ciclo celular y más. En los últimos años, debido al rápido desarrollo de la tecnología, la proteómica se ha utilizado en la investigación médica y de fármacos. Por ejemplo, es posible que la investigación sobre medicamentos no se utilice ampliamente en China, pero ha comenzado a utilizarse cada vez más en Europa y Estados Unidos. Tomando como ejemplo la hepatotoxicidad, la proteómica puede proporcionar métodos de investigación para la evaluación temprana de la hepatotoxicidad en el desarrollo de fármacos.

Ejemplos de aplicación de la proteómica en el descubrimiento de fármacos

Entonces, ¿cómo aplicar la proteómica al desarrollo clínico y de fármacos? ¡Es la necesidad de una tecnología proteómica dirigida! Anteriormente, la proteómica se utilizaba principalmente para descubrir nuevas incógnitas, como péptidos, complejos proteicos y modificaciones postraduccionales de proteínas. Esta parte tiene una amplia gama de aplicaciones, el umbral técnico es relativamente bajo y los métodos son relativamente comunes. Pero el problema es que este método no puede manejar una gran cantidad de muestras clínicas y la reproducibilidad y precisión no pueden cumplir con los requisitos.

Como resultado, el análisis dirigido comenzó a aumentar, es decir, antes del análisis, sabemos claramente qué sustancias deben analizarse y luego seleccionarlas para un análisis cuantitativo preciso. No necesitamos verificar miles de proteínas a la vez, pero necesitamos verificar una docena o docenas de proteínas que nos interesan en cientos de muestras matutinas, y estas proteínas suelen ser proteínas con concentraciones muy bajas, básicamente métodos tradicionales. se omite (explicaré en detalle por qué se omite más adelante). ¡Con tecnología específica, la investigación sobre biomarcadores de diagnóstico clínico tiene mayores posibilidades y un apoyo más fuerte!

Luego, de acuerdo con las ideas didácticas del docente, se compartirán los resultados desde tres aspectos: detección cualitativa, detección cuantitativa y proteómica dirigida.

Pruebas cualitativas

Ya sean pruebas cualitativas o cuantitativas, la preparación de muestras es una preparación inevitable. Las muestras de proteínas utilizadas para el análisis de espectrometría de masas provienen de una amplia gama de fuentes. Siempre que incluya proteínas, se pueden utilizar como fuente. Para muestras complejas, como muestras de tejidos o fluidos corporales humanos, la extracción de proteínas y la eliminación de picos a menudo requieren un procesamiento complejo y delicado, y el flujo de procesamiento varía según la muestra y el propósito de la investigación. Esta parte del contenido se presentará en detalle en la segunda conferencia "Pretratamiento de muestras". Los amigos interesados ​​pueden esperar mis próximas notas de la conferencia ~

En otras palabras, hay dos ideas para la detección cualitativa de proteínas. : De abajo hacia arriba y de arriba hacia abajo. De arriba hacia abajo se refiere a la fragmentación de una proteína intacta en espectrometría de masas, y la secuencia de la proteína se infiere mediante la detección de moléculas fragmentadas. El método ascendente, el método de escopeta que representa la gran mayoría de las aplicaciones, aprovecha al máximo las características de la proteína misma: puede ser escindida por enzimas específicas en sitios específicos. La idea básica es digerir primero la secuencia de proteínas con proteasa y luego identificar los péptidos digeridos, de modo que el objeto de detección que ingresa al espectrómetro de masas sea siempre el péptido, y luego la secuencia de proteínas se deduce en función de la secuencia del péptido.

Métodos comunes para la investigación de proteínas basados ​​en espectrometría de masas

A continuación, hablemos en detalle sobre el método ascendente/escopeta y cómo utilizar la espectrometría de masas para detectar proteínas cualitativamente. Este asunto no se puede completar en tres pasos, pero se puede lograr en siete pasos:

1. Procesamiento de muestras: obtenga varias muestras de fuentes de proteínas para su preprocesamiento y optimización.

2. Separación de proteínas: según las necesidades de la investigación, utilice la separación en gel para extraer las proteínas requeridas, o detectarlas todas sin separación, prestando atención a la eliminación de impurezas.

3. : utilizar secuencia Las enzimas específicas digieren las proteínas;

4. Separación de fragmentos de péptidos: Los fragmentos de péptidos digeridos ingresan a HPLC (cromatografía líquida de alta presión), que es lo que a menudo llamamos LC-MS dependiendo del tiempo de retención. , los péptidos se separarán previamente;

5. Ionización: ionice los péptidos separados aplicando voltaje (ESI o disociación láser asistida por matriz MALDI, no se requiere proceso de HPLC;

<) p>6. Análisis por espectrometría de masas: cuando el péptido cargado se envía para análisis por espectrometría de masas, el péptido se desviará en el campo magnético (el principio básico del análisis por espectrometría de masas) y la señal se recogerá en el espectrómetro de masas para obtener la espectro.

7. Base de datos de búsqueda: utilice software de búsqueda para analizar automáticamente espectros de masas y obtener información de secuencia de péptidos y proteínas.

Proceso general de escopeta

Recordatorio: existen muchos tipos de espectrometría de masas, como espectrometría de masas cuadrupolo, espectrometría de masas de tiempo de vuelo, espectrometría de masas con trampa de iones cuadrupolo y transformada de Fourier. espectrometría de masas, etc. Se presentarán más detalles en la Conferencia 3 "Principios, uso y mantenimiento de la espectroscopia de proteínas".

Mirándolo desde otra perspectiva, podemos resumir el proceso del shotgun de la siguiente manera:

-Generación de datos: ¿Proteínas? ¿Péptido? Espectrograma

-Análisis de datos: ¿Espectrograma? ¿Péptido? Proteína

Uno de los indicadores más críticos se llama coincidencia de espectro peptídico (PSM), que se refiere a la coincidencia de espectros y péptidos. Cuanto mejor sea la coincidencia, más precisa será la proteína inferida. Este proceso de comparación es lo que a menudo llamamos búsqueda en la base de datos. Luego compartiré los conocimientos previos que aprendí en el curso, las herramientas y algoritmos de búsqueda y la evaluación de los resultados de búsqueda.

1. Introducción a los antecedentes

La espectrometría de masas suena muy sofisticada, no importa lo costosa que sea, consta de tres partes: fuente de iones + analizador de espectrómetro de masas + detector.

Como todos sabemos, un espectrómetro de masas puede tener más de una fuente\analizador\detector de iones, y se pueden conectar varios en serie para diferentes necesidades de análisis.

Hablemos primero de la fuente de iones.

¡La ESI (ionización por electropulverización) utilizada en espectroscopia de proteínas es una invención histórica de la proteómica! Debido a que se ioniza directamente de la fase líquida, es más fácil de combinar con LC (cromatografía líquida). Podemos usar LC para preseparar mezclas de péptidos muy complejas para reducir la complejidad de cada analito, y luego los péptidos separados pueden ir directamente a ESI para formar un aerosol de ionización.

Entonces, ¿cómo se forma el spray ESI? En pocas palabras, hay una pequeña abertura en el extremo frontal de la columna de separación, y los analitos pasan a través de la pequeña abertura en el extremo frontal en secuencia según su masa y carga. Aplique voltaje a la pequeña abertura. Inicialmente, las fuerzas electrostáticas y la tensión superficial son iguales. Cuando la fuerza electrostática aumenta hasta ser mayor que la tensión superficial, la película líquida se rompe, formando innumerables gotas cargadas, formando un spray. Al igual que la tecnología nanoESI relativamente nueva, LC tiene un caudal más lento y una mejor ionización. Para aquellos que sientan que la descripción anterior no es lo suficientemente vívida, simplemente miren la imagen:

Después de hablar de la fuente de iones, hablemos de la parte más importante del espectrómetro de masas: el analizador de masas. Los nombres de varios espectrómetros de masas que escuchamos habitualmente se denominan según el tipo de analizador de espectrómetro de masas. Cada componente de nuestra muestra se ioniza en la fuente de iones y se forma en un haz de iones bajo la acción de un campo eléctrico acelerado, que ingresa al analizador de masas. El analizador de masas separa los iones cargados según la relación carga-masa y registra el número de masa y la abundancia de varios iones para su posterior análisis cualitativo y cuantitativo.

Un analizador de masas tiene dos parámetros técnicos principales: rango de masas y resolución. El rango de masa se refiere al rango de relaciones masa-carga que se pueden medir, lo que determina el rango de iones que podemos detectar. Por ejemplo, una fuente de iones ESI puede producir muchos iones con m/z mayor que 3000. Si el límite superior del analizador de masas que elija es inferior a 3000, no podrá detectar iones por encima de 3000.

¡Sin embargo, otro indicador más importante es la resolución del analizador de masas! En primer lugar, la fórmula anterior describe:

Resolución = relación masa-carga del pico del espectro de masas observado/ancho de pico a la mitad de la altura máxima (FWHM)

¿Qué ¿significar? Por ejemplo, la relación masa-carga del pico más a la izquierda en la figura siguiente es 1085,55 y el ancho del pico a la mitad de la altura del pico es 0,217, por lo tanto:

Resolución = 1085,55/0,217 = 5000.

Si aún no entiendes esto, simplemente puedes entender que cuanto mayor es la resolución del espectro de masas, más nítido y delgado será el pico. Quizás te preguntes: ¿Cuáles son los beneficios de tener picos espectrales finos y nítidos? ¡Esa es una buena pregunta! De hecho, la resolución puede caracterizar la capacidad de distinguir dos picos espectrales adyacentes en un espectro de masas. Sintamos qué diferentes patrones de picos pueden proporcionarnos los espectrómetros de masas con diferentes resoluciones.

Tomando como ejemplo el glucagón, se muestran los picos espectrales dados por espectrómetros de masas con diferentes resoluciones. Cuando la resolución es 1000, sólo se ven picos muy anchos (azules); cuando la resolución aumenta a 3000, los picos se vuelven más estrechos (rojo), pero no hay una diferencia obvia cuando la resolución aumenta a 10000, es obvio; que en realidad hay 8 picos (verde); cuando se aumenta a 30.000, el ancho del medio pico se vuelve más estrecho y dos picos adyacentes se pueden separar completamente (negro). Obviamente, cuando la resolución es 1000 o 3000, no podemos detectar con precisión el peso molecular exacto del péptido que se está analizando, lo que resulta en una falta de coincidencia espectral o una falta de coincidencia.

Los diferentes espectrómetros de masas tienen diferentes resoluciones. El orden habitual es: la espectrometría de masas por transformada de Fourier tiene la resolución más alta, pero el costo es demasiado caro, seguida por Orbitrap (serie Orbitrap), la resolución es mucho mayor que otras. Espectrometría de masas; nuevamente TOF (espectrometría de masas de tiempo de vuelo); luego trampa de iones y finalmente espectrometría de masas cuadrupolo.

Permítanme decir una cosa más: la alta resolución es buena, pero el precio es definitivamente caro. Al elegir un espectrómetro de masas, debe basarlo en sus propósitos de investigación y en su presupuesto.

Sin embargo, la identificación del péptido mediante espectrometría de masas primaria claramente no fue posible. No podemos inferir de qué residuos de aminoácidos está hecho el péptido (hay muchas combinaciones posibles) y cuál es el orden de la secuencia en función del valor del ion m/z del péptido, ¿verdad? Por lo tanto, se requiere espectrometría de masas secundaria para identificar péptidos.

¿Qué es la espectrometría de masas secundaria? En pocas palabras, el espectro primario de la mezcla de péptidos se obtiene mediante espectrometría de masas primaria y luego se selecciona un péptido a partir de él. Mediante algunos métodos, por ejemplo, los fragmentos de péptidos se fragmentan mediante colisión con un gas inerte para obtener iones fragmentados, que luego forman un espectro secundario. Observamos la distribución masiva de iones fragmentados para inferir la composición de los residuos peptídicos y, en última instancia, qué es la proteína. La última imagen te ayuda a comprender de dónde proviene el espectro de masas secundario.

En el párrafo anterior mencioné que un péptido se "selecciona" del espectrómetro de masas primario y entra al espectrómetro de masas secundario. Lo que se dice aquí puede parecer superficial, pero en realidad, ¡cómo elegir es la cuestión clave! Por lo general, el método que elegimos se puede llamar método "superior" (este es el nombre que me di). Por ejemplo, TOP15 se refiere a seleccionar los primeros 15 picos del espectro primario, aislar un péptido a la vez y luego escanear este péptido para obtener el espectro secundario.

¿Todos lo han descubierto? Si un péptido no ingresa al TOP15 en el espectro primario, ¡no es elegible para jugar en el espectro secundario! ¡Resulta que la competencia mundial en espectrometría de masas también es cruel! Los péptidos que se pueden escanear mediante espectrometría de masas secundaria se determinan mediante espectrometría de masas primaria, por lo que llamamos a este método "DDA, adquisición dependiente de datos)".

¡Mira, así surgió el nombre DDA! La próxima vez que escuches a alguien decir DDA, no tendrás cientos de signos de interrogación sobre ti, ¿verdad?

Si lo pensamos bien, no es difícil encontrar que si la concentración de una proteína no es lo suficientemente alta, es decir, es difícil que sus péptidos se conviertan en los primeros en la lista primaria. espectro, entonces es básicamente imposible que ingrese a la espectrometría de masas de nivel de espectro secundario. ¡Esta es la razón por la que las proteínas de baja curtosis son tan difíciles de identificar! ¡Es por eso que cuando tomamos muestras como sangre, debemos eliminar proteínas de alta densidad como la hemoglobina (si la proteína que desea identificar no es hemoglobina)!

¡Obviamente, las limitaciones del método DDA están ahí! ¿Cómo podría tolerar esto un científico que quería estudiar proteínas de baja curtosis? Como resultado, surgió un nuevo método llamado Adquisición Independiente de Datos (DIA). El principio de este método se presentará en detalle en el próximo tweet.

Podemos sentir la relación entre el espectrograma primario y el espectrograma secundario a través de la siguiente figura:

Por ejemplo, en el primer punto de tiempo, escaneamos MS1 y luego seleccionamos un Pico. los péptidos se escanean en busca de MS2, etc. En algunos espectrómetros de masas de barrido rápido, un espectro MS1 puede explorar 80 MS2.

Bien, hemos descubierto de dónde proviene el espectro de masas secundario, entonces, ¿cómo podemos inferir qué aminoácido es en función de la información de los iones detectados? Tal vez dirás, ¿no es esto muy simple? ¡Por peso molecular!

Sí, ¿no es el peso molecular de diferentes aminoácidos un simple valor numérico? Sin embargo, este asunto no es tan simple, porque hay otra cosa mágica en este mundo, ¡y su nombre es isótopos!

Por ejemplo, el elemento carbono más común es un elemento con un peso atómico de 12, al que llamamos C12. Sin embargo, también tiene un buen amigo igualmente estable, C13 (un neutrón más). Así que tenemos que considerar el contenido de estos dos isótopos estables (la Enciclopedia Baidu dice que el C13 representa el 1,11% y el C12 el 98,89%). Para un aminoácido, obtendremos dos pesos moleculares diferentes:

——Peso molecular de un solo isótopo, es decir, el peso molecular que contiene solo la mayor proporción de isótopos;

—— Peso molecular medio, es decir Contiene el peso molecular medio de muchos isótopos.

¿Por qué dices promedio? Porque cuanto mayor es el peso molecular del péptido, es más probable que contenga varios isótopos y diferentes combinaciones. Si calculamos el peso molecular de cada combinación, obtenemos una lista muy larga. ¿Qué valor se utilizará para la coincidencia espectral? No tengo ni idea. Así que simplemente usa un promedio para representarlo.

Podemos sentir la diferencia entre el peso molecular de un solo isótopo y el peso molecular promedio de varios residuos de aminoácidos a través de la siguiente tabla:

Tal vez te preguntes, ¿en qué situaciones? ¿Se utilizan estos dos pesos moleculares diferentes? Aquí tenemos que volver a hablar de resolución. Si usamos un espectrómetro de masas de alta resolución y los diferentes picos de isótopos están claramente separados, es decir, podemos ver varios picos de isótopos en el espectro, entonces podemos usar el peso molecular de un solo isótopo, que puede corresponder con precisión al isótopo correspondiente. cima. Pero en un espectrómetro de masas de baja resolución, es probable que estos picos se mezclen y parezcan un solo pico. En este caso no queda otra manera que aproximarlos por peso molecular medio.

La siguiente figura proporciona una representación visual de cómo los pesos moleculares de los isótopos individuales difieren del peso molecular promedio en un espectro de masas. Según el análisis de espectrometría de masas de alta resolución, se trata de dos iones completamente diferentes. Como dijimos anteriormente, los resultados del cálculo basados ​​en el peso molecular promedio no son precisos, pero los resultados del cálculo basados ​​en el peso molecular monoisotópico se pueden calcular con precisión.

Además de los isótopos, hay otro factor que también debemos tener en cuenta, y es que cuando el péptido entra en el espectro de masas secundario se pueden formar tres tipos diferentes de iones, que son los que solemos llamar por iones, ion ax, ion cz.

La razón por la que se forman diferentes pares de iones es porque diferentes métodos de fragmentación conducen a diferentes posiciones de los segmentos peptídicos. Sólo mira la imagen de arriba y lo entenderás. Cuando utilizamos CID (disociación inducida por colisión) o HCD (disociación con trampa de C de alta energía) para la fragmentación, son los enlaces C-N los que chocan con el gas inerte. Aquí los iones Y se generan en el extremo C y los iones B en el extremo N. Este es el par de iones más común generado por espectrometría de masas secundaria. Cuando utilizamos la fragmentación ETD (disociación por transferencia de electrones), debido a que hay un proceso de reacción electrónica, la fragmentación que ocurre después de agregar electrones puede ocurrir en el enlace N-C, formando iones cz, mientras que el instrumento TOF puede producir iones ax.

La información del tipo de ion debe pasarse al siguiente paso de búsqueda de biblioteca (normalmente especificamos el tipo de instrumento en el software de búsqueda de biblioteca y el software coincidirá automáticamente con el tipo de ion). La computadora necesita simular las ubicaciones de fragmentación más probables, generar los espectrogramas teóricos correspondientes y luego compararlos con los espectrogramas reales. Tomemos el ion by como ejemplo y veamos en qué fragmentos de iones podría dividirse un péptido:

Entonces podría generar un espectro como este:

Del espectro, el péptido All by Se detectan iones. En términos generales, es común que los espectrómetros de masas de alta precisión capturen completamente péptidos de buena abundancia y longitud adecuada. Normalmente, se pueden capturar entre el 50% y el 80% de los iones.

Hay mucho contenido y creo que todos se cansarán de él. No compartiré las notas de hoy. En el próximo artículo, cubriremos las herramientas de búsqueda de bases de datos, la evaluación de resultados y diversos conocimientos previos para las pruebas cuantitativas.