TBtools | Lógica de identificación de duplicaciones en tándem más sensible y precisa
Anteriormente, TBtools agregó MCScan, el trabajo inicial del Sr. Tang Haibao y el Sr. Wang Xiyin. Nota: Por supuesto, en realidad es el GUI Wrapper de MCScanX. En realidad, esta herramienta es adecuada para el análisis lineal de múltiples genomas, donde la atención se centra en múltiples genomas. Nota: Hay rumores de que no se pueden usar más de 5 genomas simultáneamente, y el software/algoritmos son de hace diez años y son ya muy poderoso. Por supuesto, la mayoría de los usos posteriores siguen siendo para ambos genomas.
Emmm, me salgo del tema.
Volver al tema. Si ejecuta MCScanX, ya sea solo o utilizando la versión de interfaz multiplataforma de TBtools, encontrará "..tandem" en el archivo de resultados. Para aquellos que lo saben, este es un registro de pares repetidos en tándem identificados por el programa.
¿Por qué? ****El propósito del análisis lineal es identificar cadenas de genes universales que están dispuestas casi en el mismo orden en diferentes ubicaciones del genoma (incluso entre genomas de diferentes especies), y las repeticiones en tándem ya están en una ubicación, ¿para qué complicarse? ¿Con ellos paño de lana?
Después de pensarlo un poco, comprenderá que el propósito de MCScan es poligénico, y que las ideas reales de análisis lineal y de doble gen deben provenir de CollinearScan. Nota: Los primeros trabajos del Sr. Wang Xiyan en realidad coexiste con MCScan, hay otro software i-ADHoRe con muchas aplicaciones. La idea de este software es más simple.... Se puede considerar que CollinearScan trata una cadena de genes como una secuencia, y luego solo ... Programación dinámica de comparación de secuencia dual. No podría ser más ingenioso... Nota: Antes de leer la literatura, pensé en un algoritmo similar a i-ADHoRe... No esperaba que fuera tan fácil de convertir.
Bueno, dado que queremos convertir cadenas de genes en secuencias, tiene sentido simplemente ponerlas en orden y luego hacer una comparación de secuencia doble. Nota: los algoritmos de Needleman o Waterman... pueden manejarlo. pero las repeticiones en tándem resultarán en deducciones de puntos. Por tanto, la solución dada por el autor es eliminar primero las partes repetidas en serie, por ejemplo, reducirlas a una. Por lo tanto, puede comprender por qué MCScanX tiene resultados de duplicación en tándem...
Emmm...MCScanX tiene lógica de identificación de duplicación en tándem y salida de resultados. Sin embargo, para aquellos que están más atentos, pueden utilizar la función de visualización de la posición de los genes de TBtools para ver la distribución cromosómica de las familias de genes y las repeticiones en tándem identificadas por MCScanX.
Estos resultados pueden ser abrumadores... De hecho, también me llevó a una presentación en vivo que hice hace dos años: una voltereta, aunque lo olvidé, después de todo, el redondeo es mi especialidad.
Más tarde... también a finales del año pasado, el tema me pidió ver cuántos genes repetidos en tándem hay en una especie concreta... y cuál es la situación. Por supuesto, cualquier algoritmo tiene limitaciones al considerar los eventos de inversión. Todavía escribí uno yo mismo. Los resultados son los siguientes:
Los anteriores son los resultados de rendimiento en la piña... Los genes repetidos en tándem que deben identificarse, por supuesto, pueden identificarse por usted. Esta función no está abierta porque... tal vez no mucha gente la use, por lo que no es necesario abrirla... Abrirla generará responsabilidad por parte de algunas personas, como por ejemplo "¿Son confiables las secuencias repetidas en tándem reconocidas por TBtools?" ? ¿Confiable o no?", ¿realmente puedes determinar la ubicación exacta observando la anotación genética? Es una pérdida de tiempo hacer esta pregunta...
Por supuesto, TBtools no está diseñado para identificar repeticiones en tándem; Otros usos Esta vez, tal vez todos nos quedemos en casa y comparemos genomas todos los días... Entonces, de vez en cuando alguien preguntará, ¿por qué la secuencia de repetición en tándem de MCScanX está incompleta? ¿Cuál es el parámetro y el otro es el gen objetivo? El tamaño del grupo de genes homólogos. Pero los parámetros se han movido, lo que puede generar más falsos positivos, lo juzgo según los resultados de su análisis. Es hora de mirar el código fuente. Nota: mire esto. Código fuente... Prefiero leer artículos o pensar en una nueva lógica.
Emmm, el jcvi posterior del Sr. Tang debería tener mejoras considerables, pero... las nuevas versiones siempre son mejores, así que no entraré en detalles aquí.
Más cerca de casa, a medida que TBtools hace que el análisis genómico comparativo sea más accesible para más personas, esto a su vez ha llevado a un aumento en los problemas de uso. La solución a un problema es no permitir que se haga la pregunta.
Por lo tanto, adjunté directamente la lógica de identificación de duplicados de concatenación de TBtools al final del proceso MCScanX Wrapper, generando los resultados de identificación de la concatenación predeterminada y TBtools. Los usuarios pueden ver los resultados que les gustan....
De repente, pensé en otra cosa. Algunas personas dicen que TBtools es un contenedor para varios programas. Ni siquiera querrás tomarte el tiempo para entender que TBtools tiene más de 130 funciones, mientras que Wrapper tiene menos de 10, y se garantiza que cada Wrapper es multiplataforma, pruébalo….
También hay muchas lógicas/algoritmos que personalmente implementé/pensé desde cero, pero tal vez solo las personas que me conocen relativamente bien lo sepan. Aun así, esto todavía me hace pensar que este posicionamiento no es bueno. Estoy pensando en hacer otra cosa.
Bueno, llevo entre tres y cinco días sin twittear... principalmente porque hay demasiadas cosas, y también porque realmente no hay nada mejor. Sí, o:
Emmm... Si no hay nada que publicar, no lo publicaré,
Les deseo buena suerte a todos
No ¡No olvides actualizar TBtools...!