¿Qué es Hadoop? ¿Puedes explicarlo en detalle? ¿Cómo utilizar?
1. Hadoop es una infraestructura de sistema distribuido desarrollada por la Fundación Apache. Los usuarios pueden desarrollar programas distribuidos sin conocer los detalles subyacentes de la distribución. Hadoop implementa un sistema de archivos distribuido (HadoopDistributedFileSystem), denominado HDFS.
2. Hadoop es un marco para ejecutar aplicaciones en grandes grupos de dispositivos de hardware económicos. Hadoop proporciona un conjunto estable/confiable de interfaces y movimiento de datos de forma transparente a las aplicaciones.
3. El nombre Hadoop no es una abreviatura, sino un nombre ficticio. El creador del proyecto, Doug Cutting, explica el origen del nombre de Hadoop: "Mis hijos le dieron el nombre a un elefante de juguete color canela. Hadoop es una plataforma informática distribuida que facilita a los usuarios su diseño y uso.
4. Puede ser parte de un clúster de Hadoop o de un sistema de archivos distribuido independiente. Es un sistema de almacenamiento de archivos gratuito de código abierto para el procesamiento de big data.