¿Qué es un almacén colmena de big data?
Hive es una herramienta de almacenamiento de datos basada en Hadoop que puede asignar archivos de datos estructurados a una tabla y proporcionar funciones de consulta similares a SQL. Su esencia es convertir HQL en un programa MapReduce.
Almacén de datos construido en base a Hadoop;
Uso de HQL como interfaz de consulta
Uso de almacenamiento HDFS
Uso de MapReduce para cálculo
Buena flexibilidad y escalabilidad: admite UDF, formatos de almacenamiento personalizados, etc. ;
Adecuado para procesamiento de datos fuera de línea