Red de conocimiento informático - Material del sitio web - Análisis de big data: elegir el estanque adecuado para peces grandes

Análisis de big data: elegir el estanque adecuado para peces grandes

Análisis de Big Data: atrapar peces grandes en el estanque correcto

El libro del gurú de marketing número uno del mundo, Jay Abraham, "Capturar peces grandes en el estanque correcto" describe diferentes grupos de clientes como peces y la colección de diferentes grupos de clientes. Son estanques diferentes. Las empresas deben pensar en cómo utilizar los estanques que se han establecido a partir de otros para encontrar rápidamente clientes objetivo en función de sus propios clientes objetivo.

El análisis de big data desafía ilimitadamente La encuesta de Gartner muestra: el 55% de las empresas están implementando soluciones de big data para mejorar la experiencia del cliente, el 49% de las empresas están utilizando soluciones de big data para mejorar la eficiencia de los procesos; para nuevos productos, construir nuevos modelos de negocio. Sin embargo, el análisis de big data es un desafío importante que enfrentan las empresas de hoy, porque las empresas no solo necesitan administrar la creciente cantidad de datos nativos sino que, en el Internet de las cosas (IoT) altamente desarrollado de hoy, los datos masivos provienen de diversas fuentes, incluidas; sensores, maquinaria, etc. Dispositivos, algunos provienen de las redes sociales, etc. La diversidad de fuentes de datos crea obstáculos para el análisis de big data de las empresas.

El requisito previo para resolver los problemas anteriores es que las empresas deben elegir la plataforma de análisis de big data adecuada, es decir, elegir el estanque adecuado. Sólo así se podrá pescar el "pez grande" en un estanque pequeño. cantidad de datos.

Cuando se trata de análisis de big data, se puede decir que Dell Cloudera Data Analytics es omnipotente. No hay duda de que Hadoop es la plataforma de análisis de datos más popular para las empresas. Sin embargo, hay muchas cosas que requieren una cuidadosa consideración al instalar, configurar y ejecutar un clúster de Hadoop. Por ejemplo, en términos de software, ¿cómo elegir el software escalable distribuido Hadoop y el software de monitoreo y gestión adecuados? En términos de hardware, ¿cómo distribuir los nodos físicos de los servicios de Hadoop? ¿Cómo elegir el servidor adecuado? En términos de funcionalidad, ¿qué tan eficaz y escalable es la plataforma Hadoop? etc.

En respuesta a esta serie de problemas con Hadoop, Dell y Cloudera lanzaron la solución de big data Dell Cloudera.

Dell Cloudera proporciona todo lo que necesita para Hadoop, incluido hardware, software, recursos y servicios. El uso de esta solución ayuda a los usuarios a resolver fácilmente diversos problemas relacionados con la implementación, la administración y otros problemas de Hadoop y a extraer valor rápidamente de cantidades masivas de datos.

Hardware y software de Dell Cloudera Dell Cloudera es una arquitectura de referencia que consta de servicios de Cloudera y Cloudera Management Suite que permite que Hadoop de código abierto se ejecute de manera eficiente en entornos de producción para empresas basadas en datos.

El hardware ofrece velocidades de procesamiento más rápidas. En términos de hardware, el servidor en rack PowerEdge C2100 de Dell y el conmutador Ethernet PowerConnect 6248 se han utilizado con éxito en implementaciones de big data, y la solución Cloudera de Dell se basa en estos componentes. El servidor Dell PowerEdge C2100 permite a los usuarios utilizar tanto la memoria como la capacidad del disco y está diseñado específicamente para maximizar el espacio, la energía y la rentabilidad en el centro de datos. La memoria y la densidad de almacenamiento son fundamentales en el centro de datos, y el PowerEdge C2100 tiene capacidad para 18 ranuras de memoria DDR3 y admite hasta 144 GB de capacidad de memoria, para que las empresas puedan obtener resultados de análisis de datos más rápido. Mientras tanto, el servidor en rack PowerEdge C2100 proporciona memoria y disco para MapReduce, análisis web y bases de datos. Además, Dell PowerConnect 6248 ofrece un conmutador completo de 48 Gigabit Ethernet y Capa 3 para admitir una densidad de rack más eficiente y funciones avanzadas para la conmutación central.

Gestión de software Hadoop para una mayor transparencia El aspecto del software proporciona una alta visibilidad dentro y entre los clústeres de Hadoop.

Dell Cloudera permite a los mantenedores de Hadoop implementar y administrar con precisión los recursos del clúster de manera eficiente combinando soporte experto con software que proporciona un control de administración transparente. Al mismo tiempo, Dell Cloudera permite métricas comerciales similares a la administración de TI moderna para ejecutar clústeres de Hadoop en entornos de producción a costos razonables y optimizar la utilización de recursos. Su previsibilidad incorporada anticipa cambios en la infraestructura de Hadoop, lo que garantiza la confiabilidad operativa.

Además, Dell brinda servicio y soporte para las soluciones de big data de Cloudera. Garantiza que las soluciones empresariales estén respaldadas por equipos de hardware y software especializados que puedan adaptarse a las necesidades específicas de la empresa.

El increíble rendimiento de la solución de big data en memoria Cloudera de Dell Dell China y el rendimiento de SAP China en el sistema de análisis de BI de la base de datos SAP HANA Tecnología totalmente flash de almacenamiento compelente para un cliente petrolero: diseño de esquema en estrella. ¿Incluyendo 2 datos de tabla de hechos, modelo de datos detallado, modelo de resumen de indicadores? ¿Datos de la tabla de 6 dimensiones, tabla de dimensiones numéricas, tabla de dimensiones de la tarjeta de identificación, tabla de dimensiones de la organización, nombre del personal, nombre de la unidad de tercer nivel, nombre de la sucursal? ¡La tabla principal contiene 18 mil millones de registros y el volumen de análisis de datos supera los 60 TB!

En el sistema original, se necesitaban más de 2 horas para calcular los resultados y era propenso a sufrir interrupciones... Después de utilizar la tecnología de almacenamiento all-flash de Dell Compellent en la nueva arquitectura de inteligencia empresarial de SAP HANA, una sola consulta se redujo a menos de 20 segundos y 400 operaciones de consulta simultáneas se redujeron a menos de 10 minutos.

La propia Dell también es usuario de esta solución de "big data" en memoria para su sistema interno de análisis y toma de decisiones inteligente de "marketing de precisión". En 2015, Dell ganó el primer lugar en el Premio a la Innovación SAP HANA-2015.

Conclusión "Los peces nadarán, las oportunidades cambiarán, debemos cambiar constantemente de posición, buscar peces grandes y tirar el cebo cuando los peces tengan hambre de atraparlos".

En esta era en la que los datos lo subvierten todo, los datos empresariales cambian constantemente y las empresas deben elegir una plataforma de análisis de datos que se adapte a ellas desde una perspectiva en continua evolución. Sólo eligiendo la plataforma adecuada podrá capturar el pez gordo del estanque de datos: el gran valor.