Cómo crear un centro de datos empresarial
Puede crear centros de datos empresariales y realizar operaciones y mantenimiento de centros de datos empresariales en el centro de gestión.
¿Qué es un centro de datos? Wikipedia define un centro de datos como "un conjunto complejo de instalaciones. Incluye no sólo sistemas informáticos y otros equipos auxiliares (como sistemas de comunicaciones y almacenamiento), sino también conexiones redundantes de comunicaciones de datos, equipos de control ambiental, equipos de monitoreo y diversos dispositivos de seguridad. ".
En el mundo actual, donde prevalece la computación en la nube, los centros de datos se están volviendo cada vez más complejos a medida que la escala de la construcción de centros de datos continúa expandiéndose y siguen surgiendo nuevas tecnologías.
Los centros de datos de gran escala suelen estar compuestos por muchos sistemas unitarios con diferentes funciones. Su trabajo de operación y mantenimiento requiere conocimientos en todos los aspectos, incluido el hardware, las redes, los servidores, el almacenamiento, la seguridad, el negocio, etc. y debe integrarse, el enlace puede realizar bien el trabajo de operación y mantenimiento.
Cuando un centro de datos tiene una escala muy grande, enfrentará más desafíos y problemas técnicos. Muchos problemas que no existen en entornos y sistemas pequeños se volverán prominentes en esta escala. hacer un buen trabajo en la operación y mantenimiento de grandes centros de datos.
Se necesita mucho tiempo para aprender sistemáticamente todos los aspectos de los sistemas técnicos involucrados en todo el centro de datos. Sólo teniendo una buena comprensión del centro de datos en su conjunto podemos proponer algunas soluciones específicas de operación y mantenimiento. .
Desarrolle algún software de monitoreo, operación y mantenimiento basado en sus propias necesidades específicas para administrar y monitorear eficientemente todo el centro de datos, mejorar la eficiencia operativa de todo el centro de datos, reducir la ocurrencia de fallas y promover continuamente El trabajo de operación y mantenimiento hacia un nuevo nivel.
Un gran centro de datos a menudo contiene muchos sistemas pequeños. El trabajo de operación y mantenimiento se lleva a cabo en torno a estos sistemas de aplicaciones específicos, que se pueden dividir en gestión básica de operación y mantenimiento, operación y mantenimiento comercial diario, red y servidor. Con respecto a las seis áreas principales de almacenamiento y seguridad, este artículo hablará sobre los métodos y capacidades de operación y mantenimiento que deben tener los grandes centros de datos en general.
En primer lugar, desde la perspectiva de la gestión básica de operación y mantenimiento del centro de datos, incluye principalmente gestión de la configuración del hardware, optimización de la mantenibilidad, monitoreo, procesamiento de alarmas, operación y mantenimiento automatizados, desconexión de la red y cortes de energía. , recuperación ante desastres y otras operaciones de mantenimiento. La gestión de la configuración de hardware incluye el modelo y la configuración de hardware de cada servidor en el gabinete, y está claro qué sistemas comerciales utilizan estos servidores.
Incluso en un entorno operativo virtualizado, es necesario saber qué máquinas físicas fluyen en el grupo de recursos. Debido a la gran cantidad de máquinas físicas y virtuales en el centro de datos, el uso de operaciones y mantenimiento automatizados es fundamental.
La operación y el mantenimiento automatizados no solo pueden mejorar la eficiencia de la operación y el mantenimiento, sino también reducir la participación manual, al tiempo que liberan mano de obra al permitir que el centro de datos se autogestione. Además, hace un buen trabajo monitorizando posibles fallos en el centro de datos y emitiendo alertas, permitiendo conocer el problema en cuanto se produce.
Muchas veces las fallas importantes comienzan a partir de fallas pequeñas y se expanden gradualmente y eventualmente causan el colapso de todo el sistema. Por lo tanto, cuando ocurren algunas pequeñas anomalías, deben eliminarse a tiempo, y estas anomalías requieren un seguimiento y control completos. Sistema alarmante para detectar. Teniendo en cuenta la operación y el mantenimiento comercial diario del centro de datos, incluye principalmente inspecciones diarias, cambios de aplicaciones, actualizaciones de software y hardware, fallas repentinas, etc.
Específicamente:
1. Inspecciones de rutina: "Un terraplén de mil millas se derrumbará en un hormiguero". Cualquier fallo puede aparecer como un pequeño peligro oculto antes de ser eliminado, lo que puede dar lugar a un fallo mayor. Por tanto, la inspección diaria del centro de datos es aburrida, pero también muy importante, y se pueden descubrir algunos peligros ocultos en el funcionamiento. a tiempo.
De acuerdo con la importancia de que el centro de datos brinde servicios, es muy necesario realizar inspecciones de rutina de todos los equipos que funcionan en el centro de datos. Compruebe si el servicio de la aplicación del servidor es normal y si la memoria de la CPU y otros usos son normales. Compruebe si el servicio de la aplicación se está ejecutando normalmente. También se debe verificar el entorno de la sala de computadoras del centro de datos para ver si la temperatura, la humedad y el polvo del entorno cumplen con los requisitos.
Si los sistemas de aire acondicionado y suministro eléctrico funcionan bien, si los equipos se sobrecalientan, y si se revisan los suelos, claraboyas, protección contra incendios, vigilancia, etc. Las fugas del aire acondicionado y de los equipos dañarán el funcionamiento normal y estable del centro de datos, así que no sea descuidado.
2. Cambios en la aplicación: los servicios que ofrece el centro de datos no permanecerán sin cambios. Con la diversificación y el desarrollo continuo de los servicios, a menudo es necesario ajustarlos, incluida la configuración del servidor y de la red. Por lo tanto, está muy familiarizado con el funcionamiento de servidores y dispositivos de red, y principalmente necesita dominar los comandos del servidor Linux y los protocolos de red.
Los cambios deben realizarse con prontitud y precisión de acuerdo con las necesidades de la aplicación.
3. Actualizaciones de software y hardware: el ciclo operativo general de los equipos del centro de datos es de cinco años. Constantemente hay equipos que deben retirarse y reemplazarse. También hay algunos equipos que deben actualizarse. a defectos de software, por lo que las actualizaciones de software y hardware también son parte del trabajo. Las actualizaciones de hardware y software requieren un mecanismo de reversión para evitar problemas que no se pueden revertir después de la actualización y que el negocio no se puede restaurar durante mucho tiempo.
Cuando se haga cargo del trabajo de mantenimiento del centro de datos, descubrirá por qué se requieren tantas operaciones de actualización casi todos los meses. Quedarse despierto hasta tarde para actualizar se ha convertido en una rutina diaria de mantenimiento. personal.
4. Fallo repentino: Ningún centro de datos está libre de fallas, y problemas de este tipo también ocurrirán durante el funcionamiento del centro de datos. Para fallas repentinas, el personal de mantenimiento de alto nivel puede analizar con calma la causa de la falla y encontrar rápidamente una solución. Si no se puede encontrar una solución en un corto período de tiempo, pueden restaurar el negocio cambiando a un equipo de respaldo y luego analizándolo. de nuevo.
En estos momentos, es crucial que el centro de datos cuente con personal de mantenimiento de alto nivel, que puede resultar útil en momentos críticos. Aunque estas tareas puedan parecer mundanas, no las subestimes. El mantenimiento de rutina del centro de datos es en realidad muy importante para el funcionamiento normal de todo el negocio del centro de datos. Sólo prestando atención al trabajo de mantenimiento del centro de datos se puede tranquilizar al centro de datos.
Si consideramos la red del centro de datos, incluye principalmente equipos de hardware de red, ACL, OSPF, LACP, VIP, análisis de protocolo, tráfico, equilibrio de carga, condiciones de capa 2, 3, 4 y 7, monitoreo de red. y placas de 10 Gigabit, conmutación de núcleos, etc.
La red es una parte importante del centro de datos y es la garantía básica para el funcionamiento de todo trabajo. Sin la red, el centro de datos no puede funcionar, por lo que garantizar la estabilidad de la red es la máxima prioridad. prioridad de los trabajos de operación y mantenimiento del centro de datos. Aquí no solo debemos prestar atención al hardware de la red, sino también a la red definida por software SDN.
Generalmente, la arquitectura de TI tradicional se implementará de acuerdo con las necesidades comerciales después de que la red esté en línea. Si las necesidades comerciales cambian, es muy engorroso modificar la configuración en el equipo de red correspondiente (enrutadores, conmutadores, firewalls). cosas.
En el cambiante entorno empresarial de Internet/Internet móvil actual, la alta estabilidad de la red y el alto rendimiento ya no son suficientes para satisfacer las necesidades empresariales, sino que la flexibilidad y la agilidad son más críticas.
Lo que hace SDN es controlar por separado los dispositivos de red y gestionarlos a través de un controlador centralizado.
No es necesario depender del equipo de red subyacente (enrutadores, conmutadores, cortafuegos), lo que protege las diferencias en el equipo de red subyacente. Al mismo tiempo, el control es completamente abierto. y estrategias de reglas de transmisión que quieren implementar, volviéndose así más flexibles e inteligentes. Después de la transformación SDN, no es necesario configurar repetidamente los enrutadores de cada nodo de la red y los propios dispositivos de la red también realizan conexiones automáticas. Sólo es necesario definir reglas de red simples en el punto de uso.
Si no le gustan los protocolos integrados en el enrutador, también puede modificarlos mediante programación para mejorar el rendimiento del intercambio de datos. Por ejemplo, los conmutadores de desarrollo propio de Baidu pueden admitir directamente las funciones de configuración y administración remotas de SDN, logrando así una configuración en línea totalmente automatizada.
En el futuro, los conmutadores de desarrollo propio irán un paso más allá y se combinarán con la automatización de servidores para mejorar la entrega y la eficiencia de la gestión de servidores. Se puede decir que la red lo abarca todo e involucra demasiados dispositivos, protocolos y tecnologías de capa de software. Por lo tanto, debemos continuar aprendiendo y profundizando nuestra comprensión de las tecnologías de red para poder hacer un buen trabajo en la operación y mantenimiento de la red. .
Desde la perspectiva de los servidores del centro de datos, existen principalmente sistemas de archivos, ajuste de parámetros del kernel, varios discos duros, versiones del kernel, pánicos del kernel, etc.
El sistema Linux ocupa una posición importante no solo en los servidores, sino también en los sistemas operativos de red. Sólo dominando el uso del sistema Linux podemos hacer frente mejor a la operación y el mantenimiento de los servidores y equipos de red. una habilidad básica para trabajos de operación y mantenimiento. Además de estar familiarizado con el funcionamiento del sistema Linux, también debe monitorear y administrar el estado de ejecución del servidor y el estado de ejecución del kernel para reducir la ocurrencia de fallas del servidor.
En términos generales, los grandes centros de datos contienen decenas de miles de servidores, y los servidores tienen varios problemas casi todos los días. Sólo si tenemos un conocimiento profundo de los servidores podemos solucionarlos bien.
Para evitar que una falla del servidor provoque una interrupción del negocio, la tecnología de virtualización o agrupación en clústeres generalmente se implementa en el servidor. De esta manera, cuando falla el hardware físico del servidor, el negocio se puede cambiar sin problemas a otro. servidores, y el negocio no se verá afectado de ninguna manera. Estas tecnologías de virtualización aumentan la dificultad de operación y mantenimiento y también requieren una investigación continua y profunda sobre las tecnologías de virtualización.
Además, la personalización de los servidores del centro de datos también es algo muy significativo. La computación en la nube requiere una implementación a gran escala, por lo que los servidores deben implementarse de manera más densa, ser más eficientes energéticamente y más fáciles de administrar, pero los requisitos de potencia informática de cada nodo no son altos.
Los servidores comunes producidos por los proveedores se centran más en el rendimiento y la escalabilidad que en el costo y el consumo de energía porque deben adaptarse a una amplia gama de aplicaciones. Si el servidor está personalizado específicamente para la nube, se optimizará para las características de la nube y así satisfacer mejor las necesidades del usuario.
Para las empresas, los beneficios son obvios. Piénselo, incluso si el ahorro de energía por servidor personalizado es limitado (4 fuentes de alimentación en lugar de 2), a largo plazo, para un centro de datos implementado a gran escala, los ahorros de costos son obvios.
Por ejemplo, los servidores propiedad de Google están diseñados internamente con bandejas personalizadas y baterías integradas para energía de respaldo, lo que ahorra a Google en comparación con los servidores tradicionales que cuestan mucho menos y consumen mucha menos energía. Gastos de electricidad.
Considerando el almacenamiento del centro de datos, su arquitectura es más diversa y compleja. Después de que la computación en la nube, la virtualización, los big data y otras tecnologías relacionadas ingresaron al centro de datos, el almacenamiento ha experimentado cambios tremendos. El almacenamiento en bloques, el almacenamiento de archivos y el almacenamiento de objetos admiten la lectura de múltiples tipos de datos y el almacenamiento centralizado ya no es exclusivo del centro de datos. Arquitectura de almacenamiento convencional.
El acceso al almacenamiento de datos masivos requiere una arquitectura de almacenamiento distribuido altamente escalable y escalable. Con el soporte de sistemas a gran escala, tecnologías como los sistemas de archivos distribuidos y el almacenamiento de objetos distribuidos brindan alta escalabilidad, escalabilidad y soporte extremadamente elástico, así como un potente rendimiento de acceso a datos para el almacenamiento de diversas aplicaciones. Gracias a estas tecnologías distribuidas se ha logrado la estandarización del hardware.
Permite construir y operar almacenamiento de centros de datos a gran escala a bajo costo. Por supuesto, el almacenamiento distribuido no pretende reemplazar las matrices de discos existentes, sino que es una nueva forma de sistema de almacenamiento que ha surgido en respuesta al rápido crecimiento del volumen de datos y el ancho de banda. El otro es el almacenamiento definido por software, que representa la tendencia de separación de software y hardware en la arquitectura de almacenamiento, es decir, la separación de la capa de datos y la capa de control.
Para los usuarios del centro de datos, la gestión y programación de los recursos de almacenamiento se puede realizar a través de software, y se puede realizar la virtualización, abstracción y automatización de los recursos de almacenamiento, lo que puede realizar completamente la implementación, gestión y monitoreo de los sistemas de almacenamiento del centro de datos, ajuste y otros requisitos, haciendo que el sistema de almacenamiento sea flexible, gratuito y altamente disponible.
Los datos empresariales y los datos de Internet están creciendo a una tasa anual del 50%. La cantidad total de datos estructurados en datos nuevos es limitada. La mayoría de los datos son datos no estructurados y semiestructurados. La arquitectura requiere Es extremadamente elástico y puede adaptarse continuamente a medida que se desarrolla el negocio. El bajo costo, la expansión masiva y el alto rendimiento de concurrencia son los atributos técnicos básicos de la arquitectura de almacenamiento que se ejecuta en los centros de datos en la nube a gran escala.
Cómo almacenar y aplicar el procesamiento en profundidad de grandes cantidades de datos complejos y desordenados, y extraer rápidamente información valiosa para tomar decisiones comerciales, también se convertirá en la base para la supervivencia de todo tipo de empresas. como la futura arquitectura de almacenamiento y almacenamiento. Direcciones de desarrollo empresarial derivadas continuamente.
Finalmente, desde la perspectiva de la seguridad del centro de datos, la seguridad consta de algunos proyectos pequeños: protección contra ataques, actualización de copias de seguridad, detección/búsqueda de errores, herramientas de secuencias de comandos, seguridad de datos, inspección de servicios y otros proyectos, cada uno de los cuales cual El proyecto en realidad contiene mucho contenido.
Por ejemplo, cuando se trata de protección contra ataques, se refiere principalmente a evitar que intrusos externos anormales lancen ataques maliciosos e involuntarios en el centro de datos. Los ataques maliciosos se refieren a que alguien utiliza deliberadamente varios métodos de ataque para ingresar al centro de datos y robar o destruir datos importantes para lograr sus motivos ocultos.
También existe un ataque involuntario, debido a que todo el centro de datos está interconectado con el mundo exterior y su funcionamiento cambia dinámicamente, es inevitable que algún tráfico anormal ataque el centro de datos, a veces incluso desde dentro de los datos. Ataques, como envenenamiento de servidores, fallos de hardware, etc.
Los bucles construidos, el tráfico anormal y otras fallas de la red afectarán el funcionamiento del centro de datos. Por lo tanto, cómo atacar y proteger el centro de datos es un tema importante. Esto puede resolverse implementando algunos dispositivos de seguridad en el centro. Requiere una planificación integral y unificada de todo el centro de datos y la implementación específica de algunas medidas de seguridad.
Y con la mejora de diversas tecnologías de piratería, las medidas de seguridad también deben fortalecerse continuamente. Este es un proceso de aprendizaje y mejora continuos mientras el centro de datos siga funcionando, esta mejora no se detendrá. Para facilitar la operación y el mantenimiento, se debe realizar bien parte del trabajo de ejecución del script, de modo que cuando ocurran emergencias, los problemas se puedan resolver rápidamente.
Por ejemplo, si el negocio de un determinado centro de datos es anormal, para restaurarlo rápidamente, es necesario ajustar el enrutamiento para guiar todo el tráfico a otros centros de datos. Esto requiere ajustes en el núcleo. enrutador En este caso, se puede ejecutar automáticamente un script listo para lograr un cambio rápido. El centro de datos también debe tener scripts listos para muchos otros trabajos que puedan usarse rápidamente en caso de emergencia.
A través del análisis anterior, debe sorprenderse al descubrir que la operación y mantenimiento del centro de datos incluye tantos elementos, tanto grandes como pequeños, y el contenido de cada elemento. No son tan simples como parece y también implican muchos conocimientos técnicos. Normalmente, un centro de datos es un centro de procesamiento de información para una empresa, empresa o departamento gubernamental.
Casi todos los negocios sólo pueden completarse a través de centros de datos, por lo que los centros de datos son cruciales para una empresa o departamento gubernamental. Para que un centro de datos pueda funcionar de manera estable y eficiente, la operación y el mantenimiento son la verdadera clave. Sólo cuando el trabajo de operación y mantenimiento en estos aspectos se realiza bien, el centro de datos podrá funcionar de manera estable durante mucho tiempo.