¿Cuál es la diferencia entre "distribuido" y "clúster"?
En pocas palabras, la distribución mejora la eficiencia al acortar el tiempo de ejecución de una sola tarea, mientras que la agrupación en clústeres mejora la eficiencia al aumentar la cantidad de tareas ejecutadas por unidad de tiempo. \x0d\ Por ejemplo: \x0d\ Si una tarea consta de 10 subtareas y cada subtarea tarda 1 hora en ejecutarse individualmente, entonces se necesitarán 10 horas para ejecutar la tarea en un servidor. \x0d\ Utilizando una solución distribuida, se proporcionan 10 servidores. Cada servidor solo es responsable de procesar una subtarea, independientemente de las dependencias entre las subtareas. Solo toma una hora completar esta tarea. (Un representante típico de este modelo de trabajo es el modelo de computación distribuida Map/Reduce de Hadoop) \x0d\ Usando una solución de clúster, también se proporcionan 10 servidores, y cada servidor puede manejar esta tarea de forma independiente. Supongamos que llegan 10 tareas al mismo tiempo y que 10 servidores funcionarán al mismo tiempo. Después de 10 horas, se completarán 10 tareas al mismo tiempo, de esta manera, ¡una tarea se completará en 1 hora! \x0d\ El siguiente es un extracto de un artículo en línea: \x0d\ 1. Concepto de clúster \x0d\ 1. Dos características clave \x0d\ Un clúster es un grupo de entidades de servicio que trabajan juntas para proporcionar una mayor escalabilidad que un solo servicio. entidad y usabilidad de la plataforma de servicios. Desde la perspectiva del cliente, un clúster parece una entidad de servicio, pero en realidad consta de un conjunto de entidades de servicio. En comparación con una única entidad de servicio, un clúster proporciona las siguientes dos características clave: \x0d\ · Escalabilidad: el rendimiento del clúster no se limita a una única entidad de servicio, y se pueden agregar dinámicamente nuevas entidades de servicio al clúster, mejorando así el desempeño del cluster. \x0d\ · Alta disponibilidad: el clúster protege a los clientes de encontrar fácilmente advertencias de fuera de servicio a través de la redundancia de entidades de servicio. En un clúster, varias entidades de servicio pueden proporcionar el mismo servicio. Si una entidad de servicio falla, otra entidad de servicio se hará cargo de la entidad de servicio fallida. La función proporcionada por el clúster para recuperarse de una entidad de servicio fallida a otra entidad de servicio mejora la disponibilidad de la aplicación. \x0d\ 2. Dos capacidades principales\x0d\ Para tener escalabilidad y alta disponibilidad, el clúster debe tener las dos capacidades siguientes: \x0d\ · Equilibrio de carga: el equilibrio de carga puede distribuir las tareas de manera uniforme a la red y al entorno informático del clúster. recursos. \x0d\ · Recuperación de errores: por alguna razón, el recurso que realiza una determinada tarea falla y el recurso que realiza la misma tarea en otra entidad de servicio continúa completando la tarea. Este proceso en el que un recurso de una entidad no puede funcionar y el recurso de otra entidad continúa completando la tarea de forma transparente se denomina recuperación de errores. \x0d\Tanto el equilibrio de carga como la recuperación de errores requieren que existan recursos que realicen la misma tarea en cada entidad de servicio, y para cada recurso de la misma tarea, la vista de información (contexto de información) requerida para realizar la tarea debe ser la misma. 3. Dos tecnologías principales La función de la entidad de servicio. Tener una única dirección de clúster (también llamada imagen única) es una característica esencial de un clúster. La configuración que mantiene las direcciones del clúster se denomina equilibrador de carga. El equilibrador de carga es internamente responsable de gestionar la entrada y salida de cada entidad de servicio, y el externo es responsable de convertir la dirección del clúster en la dirección de la entidad de servicio interna. Algunos balanceadores de carga implementan algoritmos de equilibrio de carga reales, mientras que otros solo admiten el cambio de tareas. Los equilibradores de carga que solo implementan el cambio de tareas son adecuados para entornos de clúster que admiten ACTIVE-STANDBY, donde solo una entidad de servicio está trabajando en el clúster. Cuando la entidad de servicio en funcionamiento falla, el equilibrador de carga transfiere las tareas posteriores a otra entidad de servicio. \x0d\ · Comunicación interna: para trabajar juntos, lograr el equilibrio de carga y la recuperación de errores, cada entidad del clúster debe comunicarse de vez en cuando, como la comunicación del balanceador de carga de la información de prueba de latidos de las entidades de servicio y la información del contexto de ejecución de tareas entre los servicios. entidades.
\x0d\ Tener la misma dirección de clúster permite a los clientes acceder a los servicios informáticos proporcionados por el clúster. Las direcciones internas de cada entidad de servicio están ocultas bajo una dirección de clúster, de modo que los servicios informáticos requeridos por los clientes se puedan distribuir entre cada entidad de servicio. La comunicación interna es la base para el funcionamiento normal del clúster, lo que le permite tener capacidades de equilibrio de carga y recuperación de errores. \x0d\ 2. Clasificación de clústeres \x0d\ Los clústeres de Linux se dividen principalmente en tres categorías (clúster de alta disponibilidad, clúster de equilibrio de carga, clúster de computación científica) \x0d\ Clúster de alta disponibilidad (clúster de alta disponibilidad) \x0d\ Clúster de equilibrio de carga (carga Balance Cluster)\x0d\Scientific Computing Cluster (Clúster de computación de alto rendimiento)\x0d\ Incluye específicamente:\x0d\ share-nothing cluster, etc.)\x0d\ Linux Load Balance cluster de equilibrio de carga\x0d\ (LVS, etc.). .)\x0d\ Linux Computación de alto rendimiento Clúster de computación científica de alto rendimiento\x0d\ (Clúster de clase Beowulf....) \x0d\ 3. Introducción detallada\x0d\ 1. Clúster de alta disponibilidad ", "Copia de seguridad mutua de doble máquina ", "Máquina dual". \x0d\ Los clústeres de alta disponibilidad resuelven el problema de garantizar la capacidad de las aplicaciones de usuario para continuar brindando servicios al mundo exterior. (Tenga en cuenta que los clústeres de alta disponibilidad no se utilizan para proteger los datos comerciales, sino para proteger los programas comerciales de los usuarios para proporcionar servicios ininterrumpidos al mundo exterior y minimizar el impacto de las fallas de software/hardware/causadas por humanos en el negocio) . \x0d\ 2.Clúster de equilibrio de carga\x0d\ Sistema de equilibrio de carga: todos los nodos del clúster están activos y comparten la carga de trabajo del sistema. Generalmente, los clústeres de servidores web, los clústeres de bases de datos y los clústeres de servidores de aplicaciones pertenecen a este tipo. \x0d\ Los clústeres de equilibrio de carga se utilizan generalmente para servidores web y servidores de bases de datos correspondientes a solicitudes de red. Este tipo de clúster puede, al recibir una solicitud, verificar los servidores que aceptan menos solicitudes y no están ocupados, y transferir la solicitud a estos servidores. Desde el punto de vista de verificar el estado de otros servidores, el equilibrio de carga y la agrupación en clústeres tolerantes a fallas están muy cerca, excepto que hay más. \x0d\ 3. Clúster de informática científica (Clúster de informática de alto rendimiento)\x0d\ Clúster de informática de alto rendimiento (Computación de alto rendimiento), denominado clúster HPC. Este tipo de clúster está dedicado a proporcionar potentes capacidades informáticas que una sola computadora no puede ofrecer. \x0d\ 3.1 Clasificación de informática de alto rendimiento \x0d\ 3.1.1 Computación de alto rendimiento Qué conexión. SETI@HOME -- Búsqueda de Inteligencia Extraterrestre en Casa es una aplicación de este tipo.
Este proyecto utiliza recursos informáticos inactivos en Internet para buscar extraterrestres. El servidor del proyecto SETI envía un conjunto de datos y patrones de datos a los nodos informáticos que participan en SETI en Internet. Los nodos informáticos buscan los datos dados utilizando los patrones dados y luego envían los resultados de la búsqueda al servidor. El servidor es responsable de recopilar los datos devueltos por varios nodos informáticos en datos completos. Debido a que una característica única de este tipo de aplicación es la búsqueda de ciertos patrones en cantidades masivas de datos, este tipo de cálculo se denomina computación de alto rendimiento. En esta categoría entra la llamada informática de Internet. Según la clasificación de Flynn, la informática de alto rendimiento pertenece a la categoría SIMD (Instrucción única/Datos múltiples). \x0d\ 3.1.2 Computación distribuida\x0d\ Otro tipo de cálculo es todo lo contrario de la computación de alto rendimiento. Aunque se pueden dividir en varias subtareas paralelas, las subtareas están estrechamente conectadas y requieren una gran cantidad de intercambio de datos. Según la clasificación de Flynn, la informática distribuida de alto rendimiento pertenece a la categoría MIMD (Instrucción múltiple/Datos múltiples). \x0d\ 4. La conexión y la diferencia entre distribuido (clúster) y clúster \x0d\ Distribuido se refiere a distribuir diferentes servicios en diferentes lugares; el clúster se refiere a reunir varios servidores para realizar el mismo negocio. \x0d\ Todos los nodos de la distribución se pueden agrupar. Y un clúster no está necesariamente distribuido. \x0d\ Por ejemplo: tome Sina.com. Si hay más personas visitando, puede ser un clúster. Se coloca un servidor de respuesta al frente y los siguientes servidores completan el mismo negocio. El servidor de respuesta depende de qué servidor la carga no sea muy pesada, sea cual sea la máquina que se utilice para completarla. \x0d\ Distribuido, entendido en un sentido estricto, es similar a un clúster, pero su organización es relativamente flexible. A diferencia de un clúster, tiene una estructura organizativa. Si un servidor colapsa, otros servidores pueden tomar el relevo. \x0d\ Cada nodo distribuido completa diferentes servicios. Si un nodo colapsa, el servicio será inaccesible.