Red de conocimiento informático - Aprendizaje de programación - Hadoop por favor avise sobre la secuencia de aprendizaje

Hadoop por favor avise sobre la secuencia de aprendizaje

Aunque me dedico al trabajo de Hadoop, no soy un experto después de todo, solo tengo un año de experiencia.

Comparte tu experiencia de aprendizaje.

Para comprender el mecanismo operativo de Hadoop, puede aprender la guía autorizada de Hadoop o la práctica de Hadoop;

Para comprender el proceso operativo de Hadoop, comprenda los principales scripts de ejecución en HADOOP_HOME/bin/.

Ver core-default.xml/hdfs-default.xml/mapred-default.xml y otros archivos de configuración predeterminados

, y core-site.xml/hdfs-site.xml / mapred-site.xml y otros archivos relacionados, aprenda

cómo optimizar parámetros y domine cómo configurar y leer archivos comprimidos, el gzip predeterminado y

lzo personalizado, aprenda cómo personalizar Define Combiner/Patitioner, etc., dominar las diferencias y los escenarios de aplicación de varios formatos de entrada y salida

, aprender a personalizar formatos de entrada y salida y luego aprender los algoritmos de MapReduce,

como combinación en el mapa, cálculo de frecuencia relativa, algoritmo de pares, algoritmo de tiras, etc. Domina la programación

mapreduce.

Entre ellos, debe leer atentamente el código fuente de Hadoop en el directorio HADOOP_HOME/src/.

Este es el mayor beneficio del código abierto. Es un poco confuso, pero aprendamos de ello