Red de conocimiento informático - Aprendizaje de programación - Al crear una tabla particionada externa en Hive, ¿la ubicación especifica la ubicación de almacenamiento de datos o hace referencia a la fuente de datos?

Al crear una tabla particionada externa en Hive, ¿la ubicación especifica la ubicación de almacenamiento de datos o hace referencia a la fuente de datos?

Especifique la ubicación de almacenamiento de datos. Si no se especifica, los archivos de tabla se crearán en la ubicación predeterminada de hdfs.

Hive no tiene un formato especial de almacenamiento de datos ni un índice de datos. Los usuarios pueden organizar tablas en Hive con mucha libertad. Al crear una tabla, Hive solo necesita indicarle a Hive los delimitadores de columnas y los delimitadores de filas en los datos para analizarlos.

Todos los datos de Hive se almacenan en HDFS y Hive contiene los siguientes modelos de datos: tablas, tablas externas, particiones y depósitos.

Datos extendidos:

Las tablas en Hive son conceptualmente similares a las tablas de una base de datos. Cada tabla tiene un directorio correspondiente en Hive para almacenar datos. ?

Por ejemplo, la ruta de una tabla pvs en HDFS es: /wh/pvs, donde wh es el directorio del almacén de datos especificado por ${hive. metastore.warehouse.dir} en hive-site.xml, donde se almacenan todos los datos de la tabla (excluidas las tablas externas).

¿Partición? Corresponde a un índice denso en la columna de partición de la base de datos, pero la organización de las particiones en Hive es completamente diferente a la de la base de datos. En Hive, las particiones de la tabla corresponden a los directorios debajo de la tabla y todos los datos de la partición se almacenan en los directorios correspondientes. ?