Las ventajas y desventajas de HDFS y sus escenarios de aplicación
En el ecosistema de big data, la distribución es un concepto central. Big data, big data, una gran cantidad de datos y una gran cantidad de tipos de datos no se pueden almacenar en una sola máquina, sino en varias máquinas juntas.
Un sistema de archivos distribuido que proporciona acceso de alto rendimiento a los datos de la aplicación
Es adecuado para escribir una vez y leer muchas veces. No admite la modificación aleatoria de archivos y admite la adición de archivos. . Es adecuado para el análisis de datos.
Modificación aleatoria: Modifica la memoria escrita.
Agregar: continúa agregando contenido basado en el documento anterior.
Ventajas:
Desventajas:
Lo he probado en el trabajo real. Un archivo/directorio/bloque de archivos puede ocupar 150 B de memoria de metadatos. Si hay 1 millón de archivos pequeños y cada archivo ocupa un bloque de archivos, se necesitarán 150 b×1038 0024/65438.