Además de Spark, ¿qué otras opciones de procesamiento de big data existen?
El marco informático distribuido de la organización de código abierto Apache proporciona la arquitectura de software del sistema de archivos distribuido (HDFS), la informática distribuida MapReduce y el marco unificado de gestión de recursos (Yarn).
HBase
Es un sistema de almacenamiento distribuido escalable, altamente confiable, de alto rendimiento y orientado a columnas que se puede utilizar para construir estructuras a gran escala en servidores de PC económicos. clúster de almacenamiento.
Kafka
Apache es un sistema de bus de mensajes paso a paso de alto rendimiento y alto rendimiento.
Tempest
Sistema informático distribuido en tiempo real, tolerante a fallos. Utilice Storm para realizar análisis de big data en tiempo real.
¿Flink?
Una plataforma de procesamiento de datos escalable para procesamiento de datos por lotes y flujos. Las ideas de diseño se derivan principalmente de Hadoop, base de datos MPP, sistema informático de flujo, etc. y admite cálculos iterativos incrementales.
? ¿chispa?
Un motor informático rápido de uso general diseñado para el procesamiento de datos a gran escala.