Red de conocimiento informático - Conocimiento informático - ¿Cómo elegir una versión de Hadoop adecuada para aplicaciones empresariales o de aprendizaje?

¿Cómo elegir una versión de Hadoop adecuada para aplicaciones empresariales o de aprendizaje?

Recomiende algunos artículos de la familia Hadoop, principalmente presentando productos de la familia Hadoop. Los proyectos más utilizados incluyen Hadoop, Hive, Pig, HBase, SQOOP, Mahout, Zookeeper, AVRO, Ambari y Chukwa. Los nuevos proyectos incluyen Yarn, HCatalog, OOZIE, Cassandra, HAMA, Whirr, Flume y Bigtop.

1. Hoja de ruta de aprendizaje

La hoja de ruta de aprendizaje de la familia Hadoop es una lectura obligada.

Hoja de ruta de aprendizaje de Hive

Hoja de ruta de aprendizaje de Mahout

2. Práctica de programación

Instalación del historial de versiones de Hadoop

Uso. Maven para construir el proyecto Hadoop

La programación de Hadoop llama a HDFS

Utilice Maven para construir el proyecto Mahout

Explicación detallada de la API del algoritmo de recomendación de Mahout

Utilice MapReduce Implementación de la multiplicación de matrices

Análisis del motor de recomendación Mahout desde el código fuente

Proyecto de desarrollo de programa paso a paso Mahout CF basado en filtrado colaborativo del proyecto

Paso Mahout Clúster de desarrollo de programas paso a paso Kmeans

Implementación paralela del algoritmo PageRank

3. Análisis de casos

Uso de Hadoop para extraer indicadores estadísticos KPI para análisis masivos de registros web.

Usando Hadoop, cree un sistema de recomendación de películas

Cree un motor de recomendación de trabajos con Mahout

Mahout creó un sistema de recomendación de libros

PeopleRank descubre Valor personal desde las redes sociales.