Red de conocimiento informático - Aprendizaje de programación - La relación entre mapreduce y hbase, ¿qué descripciones son correctas?

La relación entre mapreduce y hbase, ¿qué descripciones son correctas?

La descripción correcta de la relación entre MapReduce y HBase es: los dos no están muy relacionados. HBase puede ejecutarse normalmente sin MapReduce y MapReduce puede acceder directamente a HBase.

MapReduce es un modelo de programación utilizado para operaciones paralelas en conjuntos de datos a gran escala (más de 1 TB). Facilita enormemente a los programadores ejecutar sus propios programas en sistemas distribuidos sin conocer la programación paralela distribuida. La implementación de software actual especifica una función de Mapa para asignar un conjunto de pares clave-valor a un nuevo conjunto de pares clave-valor, y especifica una función Reducir concurrente para garantizar que todos los pares clave-valor asignados sean Cada uno comparte el mismo conjunto de llaves.

HBase es una base de datos distribuida y de código abierto orientada a columnas. A diferencia de las bases de datos relacionales generales, es adecuada para el almacenamiento de datos no estructurados. Otra diferencia es que HBase se basa en columnas en lugar de filas.

MapReduce y HBase no están fuertemente relacionados. Sin MapReduce, HBase puede ejecutarse normalmente y MapReduce puede acceder directamente a HBase.

El origen de MapReduce

MapReduce fue desarrollado por primera vez por Google como un modelo y método de computación paralela para el procesamiento de datos a gran escala. La intención original de Google al diseñar MapReduce era principalmente resolver el procesamiento paralelo de datos web a gran escala en su motor de búsqueda. Después de que Google inventó MapReduce, lo utilizó por primera vez para reescribir el sistema de procesamiento de indexación de documentos web en su motor de búsqueda.

Dado que MapReduce se puede utilizar ampliamente en muchos problemas de procesamiento de datos a gran escala, desde la invención de MapReduce, Google lo ha utilizado ampliamente en muchos problemas de procesamiento de datos a gran escala. MapReduce procesa decenas de miles de problemas de algoritmos y programas diferentes dentro de Google.

Para ver el contenido anterior, consulte la Enciclopedia Baidu-MapReduce