Red de conocimiento informático - Aprendizaje de programación - La relación entre hadoop y mapreduce, gfs y otras tecnologías de Google.

La relación entre hadoop y mapreduce, gfs y otras tecnologías de Google.

En pocas palabras, Hadoop heredó las ideas MapReduce y GFS de Google, desarrolló un marco y luego se lo entregó a Apache como un proyecto de código abierto.

MapReduce nació en el laboratorio de Google. MapReduce, GFS y BigTable también se conocen como la troika de Google, y Hadoop es la implementación de código abierto de la troika de Google.

En 2003, Google publicó un artículo académico técnico "Google File System (GFS)". GFS es el sistema de archivos especializado de Google diseñado para almacenar cantidades masivas de datos de búsqueda.

En 2004, Doug Cutting, el fundador de Nutch, implementó un sistema de almacenamiento de archivos distribuido llamado NDFS basado en el documento GFS de Google.

En 2004, Google publicó otro artículo académico técnico, "MapReduce", que es un modelo de programación para operaciones de análisis paralelo en conjuntos de datos a gran escala (más de 1 TB).

En 2005, Doug Cutting implementó MapReduce en el motor de búsqueda Nutch.

En 2006, Yahoo contrató a Doug Cutting, quien actualizó NDFS y MapReduce a Hadoop. Yahoo también creó un equipo separado para Goug Cutting dedicado a Hadoop.