Experto en operación de nombres de dominio en la nube de Alibaba
"La mejor red es como Dios, en todas partes, y su existencia no se puede sentir... Es a la vez compleja y simple. Esta es la dirección de nuestros esfuerzos."? -Sun Chenghao, experto senior en tecnología de redes de Alibaba Cloud.
En la sede principal de la Conferencia de Hangzhou 2065438 en agosto, el director de productos de Alibaba Cloud, presentó la versión completamente mejorada de Tianfei 2.0, un sistema operativo en la nube desarrollado independientemente por Alibaba Cloud. Como uno de los componentes centrales de Tianfei 2.0, Luo Shen reveló su misterioso velo por primera vez. Sun, un experto senior en tecnología de redes de Alibaba Cloud, dio una explicación más detallada de Luoshen en el posterior seminario sobre tecnología de redes futuras. Este artículo explica sistemáticamente el concepto, evolución, estructura y características de Tianfei Luoshen por primera vez.
¿Qué es la Diosa Voladora?
Existe una capa de red virtual entre la red física y la red percibida por el usuario. En Alibaba Cloud, llamamos a este sistema de red virtual Luoshen. Luoshen es el sistema responsable de la red virtual de Alibaba Cloud Tianfei. Proporciona a los clientes de Alibaba Cloud una variedad de productos de red, como VPC y SLB. También es la infraestructura de red para más de 100 productos en la nube, como ECS, RDS, OSS y NAS. También ha apoyado muchos negocios de Alibaba Group y Ant Financial Group, como comercio electrónico, pagos y logística. A nivel mundial, Roselle presta servicios a más de un millón de usuarios de todos los ámbitos de la vida. Durante los períodos de mayor tráfico de Internet, como Double Eleven, la Copa Mundial y el Festival de Primavera, garantizamos silenciosamente una experiencia de red fluida para cada consumidor.
Mucha gente sabe que Alibaba Cloud tiene un sistema Apsara. Cada componente del sistema lleva el nombre de un dios diferente, incluidos Pangu, Fuxi, Nuwa, Shennong, etc. Entre ellos, Pangu es un sistema de archivos distribuido y Fuxi es un sistema de programación distribuido. ¿Por qué el sistema de red virtual se llama Luoshen? En la antigüedad, el transporte fluvial era un medio de transporte muy importante, al igual que la red que lo es hoy. Entonces, cuando nombramos el sistema de red virtual, nombramos al dios del río Luoshen.
La estructura de "Flying Goddess Luo"
Luo Shen es parte de Tianfei, el sistema operativo distribuido de Alibaba Cloud. En la infraestructura de Tianfei, la capa superior son varios productos en la nube, incluidos los productos en la nube familiares RDS, ECS, VPC, SLB, etc. Estos son los tres componentes básicos de Tianfei, incluido el sistema de almacenamiento Pangu, la gestión de recursos Fuxi y la gestión de red Luoshen. En otras palabras, Roselle no solo admite los productos de red en la nube de Alibaba Cloud, sino que también desempeña un papel importante en el soporte de la infraestructura de red de otros productos en la nube.
Hablando de la arquitectura técnica de Luoshen, el sistema Luoshen consta de tres módulos.
–Plano de datos, plano de control y plano de gestión.
El plano de datos es el responsable de procesar los paquetes de datos en la red de la nube. Es como cables de red y equipos de conmutación de enrutamiento en el mundo físico: envía paquetes de datos desde el remitente al destino con alta eficiencia y bajo retraso. De manera similar, el plano de datos de Luoshen también contiene una variedad de componentes con diferentes funciones, incluidos conmutadores virtuales que admiten varios tipos de formas informáticas, puertas de enlace DCN para la interconexión de centros de datos, puertas de enlace de Internet para conectar redes públicas y redes en la nube, y una puerta de enlace de nube híbrida que proporciona interconexión, una puerta de enlace de equilibrio de carga que proporciona capacidades de equilibrio de carga y una puerta de enlace de acceso inteligente que proporciona capacidades de acceso a terminales. Para mejorar el rendimiento de reenvío de estos componentes, Luoshen no solo utiliza tecnología de reenvío suave, sino que también utiliza ampliamente una combinación de software y hardware o incluso tecnología de hardware pura.
El plano de control controla cómo se procesan los paquetes. Él es el cerebro empresarial de Luoshen. Técnicamente hablando, el plano de control de Luoshen es un sistema de control distribuido jerárquico. El controlador de dispositivo de nivel más bajo es el principal responsable de controlar y gestionar varios componentes del plano de datos. Al mismo tiempo, existe un controlador de red virtual para cada zona y un controlador de enrutamiento global para todo el mundo. El controlador de red virtual regional es responsable de la gestión y programación de la red en la nube local, y el controlador de enrutamiento global es responsable de coordinar y programar los recursos en cada región para formar una red en la nube global.
El controlador NFV se basa en el controlador de red virtual y el controlador de enrutamiento global para completar la configuración y abstracción de funciones avanzadas de red virtual de productos como VPN.
El plano de gestión de Luoshen es el centro de operación y mantenimiento de la red, gestionando una gran cantidad de elementos y usuarios de la red. La masa aquí se refiere a decenas de millones de máquinas virtuales y millones de elementos de red. Para lograrlo, la plataforma de gestión de Luoshen se basa en big data y tecnología de aprendizaje automático. Realiza cálculos en tiempo real/fuera de línea y modelado de datos masivos generados durante la operación de la red, impulsando la planificación anticipada de los recursos de la red, el mantenimiento diario de los sistemas de red y la operación inteligente de los productos de red. Todo el plano de gestión incluye un conjunto de sistemas de análisis de datos distribuidos de alto rendimiento. Los datos analizados se proporcionan al sistema inteligente de operación y mantenimiento para completar la planificación de recursos, la construcción de redes, los cambios del sistema, el monitoreo en tiempo real, el escape de fallas y la operación del producto. y otros productos de red con un ciclo de vida completo. En última instancia, logra los efectos de eliminar cambios de red desatendidos, descubrir problemas antes que los usuarios, escapar de fallas eficiente y simple y operaciones ricas y completas de productos y usuarios.
La evolución tecnológica de Feishen
No fue un día de trabajo para Luoshen convertirse en uno de los Cuatro Pilares Feitianos. La evolución de Luoshen ha pasado por cuatro etapas.
La primera es la clásica etapa de red. En esta etapa, solo existe un concepto de red, que es el ancho de banda de la red pública. El problema en la etapa de red clásica es que los usuarios no pueden personalizar la topología de la red, lo que hace que los usuarios no puedan completar conexiones de nube híbrida en la nube. Para resolver este problema, Luo Shen entró en la etapa de VPC. En la etapa de VPC, Luoshen ha virtualizado millones de redes en cada región y los usuarios pueden personalizar completamente esta red. A medida que la escala de la red se hace cada vez mayor, Luoshen también ha entrado en la etapa de red global desde una red regional. En esta etapa, Luoshen resuelve principalmente el problema de cómo gestionar mejor las redes de ultra gran escala. La red empresarial en la nube y la red de conexión en la nube constituyen las dos características principales de la tercera generación de Luoshen.
Después de satisfacer las necesidades de los principales clientes, comenzamos a pensar en cómo mejorar aún más la experiencia del usuario. ¿Cuáles son las principales demandas de los usuarios de Internet? De hecho, la mayor queja de los clientes es que la red es lo suficientemente fuerte y confiable como para evitar problemas. Al igual que con el agua y la electricidad, los usuarios no necesitan saber dónde están la central eléctrica y la estación de bombeo. Por eso, Luo Shen quiere que la red sea ubicua y no sensible al usuario. El desarrollo de Luoshen es un proceso evolutivo de 0 a 1, a 100 y de regreso a 0. Estos son nuestros esfuerzos para desarrollar la próxima generación de Luoshen. Este es también el pensamiento detrás de nuestra primera propuesta de concepto sin red en la industria.
Características de Flying Luoshen
Las características clave de Luoshen incluyen seguridad, flexibilidad y confiabilidad, que también son características clave del estado definitivo sin red de Luoshen.
La seguridad es el disco básico. Debido a que la tecnología de superposición aísla la lógica de la red, las redes del usuario no podrían comunicarse entre sí antes. Roselle también incluye varios servicios de cifrado que pueden crear un nivel más profundo de seguridad para los usuarios. Hay dos números para la elasticidad: uno es la elasticidad del rendimiento de reenvío secundario. Luoshen admite una elasticidad de 1 MB a 1 TB por segundo y el otro es la elasticidad de escala. La red única de Luoshen admite una escala de nodo informático de 10 W. De esta manera, Luoshen no solo puede respaldar empresas tan pequeñas como servidores web virtuales, sino también soportar picos de tráfico masivos como Double 11. Cuando hablamos de confiabilidad, nos referimos al parámetro tiempo medio hasta la falla por año. El tiempo de falla de una sola instancia causado por Luoshen es de solo 50 ms, lo cual es extremadamente corto.
Diseño clave
A continuación, analizaremos en detalle el diseño clave de la resiliencia y confiabilidad de Roshen. El plano de datos del sistema Luoshen en sí es un cambio enorme. Como todos sabemos, el chip de reenvío del conmutador procesa paquetes de datos en una tubería y el procesamiento del hardware nunca se detiene. Lo mismo ocurre con el plano de datos de Luoshen. Desde el comienzo de un paquete de datos que ingresa al sistema Luoshen hasta todo el proceso de salida del sistema Luoshen, todos los componentes del sistema Luoshen no se interrumpirán, por lo que un plano de datos que solo maneja una cosa debe ser eficiente. El plano de datos de Luoshen incluye tecnología y arquitectura de reenvío que combina software y hardware. Además, la red del sistema Luoshen nunca se interrumpirá debido al mantenimiento, lo que significa que todos los componentes del sistema Luoshen admiten actualizaciones en caliente.
Desde una perspectiva de confiabilidad, la recuperación ante desastres en salas de máquinas múltiples es la base de la alta disponibilidad. Cuando comience a implementarse una sala de computadoras en la nube en un centro de datos de Alibaba Cloud, primero se implementarán las instalaciones físicas y luego se implementará el sistema Luoshen. En este momento, hay grupos informáticos, puertas de enlace y plataformas de control en la sala de ordenadores.
Existe nuestro componente de conmutador virtual en el clúster de cómputo. Los nodos clave del plano de datos y del plano de control se implementan en el clúster y los problemas con un solo nodo de servicio no tendrán ningún impacto en los usuarios. Cuando el host de una máquina virtual encuentra problemas graves, como tiempo de inactividad, se puede migrar dentro de la sala de computadoras. La migración en sí no tendrá ningún impacto en los atributos de red ni en la conectividad de la máquina virtual. Cada sala de computadoras en la nube implementará puertas de enlace de clúster y nodos de controlador. A medida que aumenta el número de salas de computadoras, se formará automáticamente una relación de respaldo cíclico en la sala de computadoras en la nube. Cuando se construye una nueva sala de computadoras y se implementa el sistema Luoshen, se unirá automáticamente a esta cadena de respaldo. De esta manera, cuando un nodo clave en una sala de computadoras encuentra un problema debido a una anomalía, puede cambiar automáticamente a la sala de computadoras de respaldo secundaria y el sistema Luoshen en la sala de computadoras de respaldo proporcionará servicios. Este mecanismo de recuperación ante desastres de varios niveles garantiza que los usuarios puedan restaurar sus servicios en poco tiempo.
?
Además de la recuperación ante desastres en salas de computadoras múltiples, cómo detectar errores rápidamente y recuperarse rápidamente es otro punto clave de confiabilidad. Para resolver este problema, Luo Shen primero diseñó un sistema de teñido basado en procesos. Si el sistema Luoshen se considera un conmutador completo, entonces, en términos de características, el sistema Luoshen es un conmutador que admite el seguimiento del tráfico y tiene varias políticas ricas. Debajo del sistema Luoshen se encuentran los dispositivos y conmutadores de red físicos. A través de las capacidades de marcado de flujo y la estrategia establecida del sistema Luoshen, puede tener la capacidad de teñir, reflejar, muestrear y rastrear mensajes específicos en redes físicas y virtuales. Los registros generados por estas operaciones se calcularán en tiempo real después de su recopilación. Si el tráfico es anormal, se generarán alertas y registros que se enviarán a los administradores. Algunas alertas pueden desencadenar el manejo y la recuperación automáticos de fallas. Algunos de los datos se calcularán y procesarán para generar informes de datos y retratos de usuarios, y también brindarles a los usuarios una pantalla grande y genial. Esta es esencialmente la capacidad de la digitalización.
Conclusión
La misión de Tianfei Luoshen es simplificar Internet. Como todos sabemos, AWS propuso el concepto sin servidor. Al igual que sin servidor, Luoshen está diseñado teniendo en mente el concepto sin red. Esperamos que a los usuarios ya no les importe la topología de la red, el ancho de banda de la red, las direcciones de red y otras tecnologías profesionales, de modo que los usuarios no sepan la existencia de la red. Networkless se logra primero mejorando continuamente la flexibilidad y confiabilidad de la red. Además, una característica clave es NAAS, que permite a los usuarios preocuparse únicamente por las comunicaciones de la red y no por los distintos componentes de la red.