¿Cuáles son los libros de introducción a big data?
1. "Guía definitiva de Hadoop"
Se acaba de lanzar la versión 3.1, pero no se recomienda oficialmente su uso en entornos de producción. Como libro de introducción a hadoop, también es una buena idea comenzar con la versión 2.x.
Este libro comienza desde el origen de Hadoop, va de lo más superficial a lo más profundo, combina teoría y práctica y presenta de manera integral Hadoop, una herramienta ideal para el procesamiento de alto rendimiento de conjuntos de datos masivos. En la versión recién actualizada, en comparación con la versión anterior, se agregaron capítulos que presentan YARN, Parquet, Flume, Crunch y Spark, lo cual es muy adecuado para principiantes en Hadoop.
2. "Learning Spark"
"Spark Rapid Big Data Analysis" es un libro preparado para principiantes de Spark. No entra en demasiados detalles de implementación, pero preste más atención. el uso específico de los usuarios de nivel superior. Sin embargo, este libro no se limita de ninguna manera al uso de Spark. También proporciona una introducción relativamente completa a los conceptos centrales y principios básicos de Spark, lo que permite a los lectores comprender qué está sucediendo y por qué.
3. "Aprendizaje automático Spark: tecnología y práctica básicas"
Le ayuda a dominar la tecnología de aprendizaje automático Spark de una manera práctica. Este libro combina teoría con una gran cantidad de ejemplos para ayudar a los desarrolladores a dominar el uso de Spark para el análisis y la implementación de algoritmos de aprendizaje automático. A través de estos ejemplos y la aplicación de Spark en varios sistemas de nivel empresarial, se ayuda a los lectores a desbloquear la complejidad de los algoritmos de aprendizaje automático de Spark y generar información valiosa a través del análisis de datos.