Red de conocimiento informático - Material del sitio web - ¿Qué tipos de soluciones de big data existen?

¿Qué tipos de soluciones de big data existen?

I.HadoopHadoop es un marco de software que permite el procesamiento distribuido de grandes cantidades de datos. Pero Hadoop lo hace de forma fiable, eficiente y escalable. Además, Hadoop depende de servidores comunitarios, por lo que el costo es relativamente bajo y cualquiera puede usarlo.

HPCC es la abreviatura de Computación y Comunicaciones de Alto Rendimiento. Sus principales objetivos son desarrollar sistemas informáticos escalables y software relacionado para soportar el rendimiento de la red a nivel de terabits, desarrollar tecnología de redes gigabit y ampliar la investigación y la conectividad en el ámbito educativo. instituciones a Internet.

Tres, Tormenta. Storm es un software gratuito de código abierto y un sistema informático distribuido en tiempo real tolerante a fallos. Storm puede manejar flujos de datos masivos de manera muy confiable y se utiliza para procesar datos por lotes de Hadoop. Storm admite múltiples lenguajes de programación y es muy divertido de usar. Storm es de código abierto para Twitter y otras empresas de aplicaciones conocidas incluyen Groupon, Taobao, Alipay, Alibaba, Le Elements, Admaster, etc.

4. Para ayudar a los usuarios empresariales a encontrar formas más eficientes y rápidas de consultar datos de Hadoop, la Apache Software Foundation lanzó recientemente un proyecto de código abierto llamado "Drill". Este proyecto ayuda a Google a analizar y procesar conjuntos de datos masivos, incluido el análisis de documentos web rastreados, el seguimiento de datos de instalación de aplicaciones instaladas en Android Market, el análisis de spam, el análisis de resultados de pruebas en el sistema de compilación distribuida de Google y más.

V. RapidMiner es, con diferencia, la solución de minería de datos líder en el mundo con tecnología avanzada. Su amplia gama de tareas de minería de datos incluye varias artes de datos, que pueden simplificar el diseño y la evaluación de los procesos de minería de datos.