Red de conocimiento informático - Aprendizaje de programación - ¿Puede Impala utilizar las funciones integradas de Hive?

¿Puede Impala utilizar las funciones integradas de Hive?

Tipos de datos no escalares como mapas, matrices, estructuras

Mecanismos de extensibilidad como conversiones, formatos de archivos personalizados o SerDes Zinpara 1.2 personalizados

Funciones XML y JSON

Algunas funciones agregadas en HiveQL: variance, var_pop, var_samp, stddev_pop, stddev_samp, covar_pop, covar_samp, corr, porcentaje, porcentaje_approximate, histogram_numeric, Collect_setImpala admite estas funciones agregadas: MAX(), MIN(), SUM(), AVG() , CONTAR().

Función de generación de tablas definida por el usuario (udtfs).

Muestreo

Vista lateral

Funciones de autorización como roles

Cada consulta dentro de una consulta tiene múltiples cláusulas diferentes.

Impala no admite actualmente estas declaraciones de HiveQL:

Tablas de análisis (hay estadísticas calculadas equivalentes en Impala)

Columnas de descripción

Describir base de datos

Exportar tabla

Importar tabla

Mostrar particiones

Mostrar tablas extendidas

Mostrar índices

p>

Mostrar columnas

En muchos casos, las sentencias y cláusulas SQL similares utilizadas en Impala y Hive tienen una semántica diferente:

Impala usa una sintaxis y un nombre de solicitud de consulta diferentes. Consulte Conexión

Impala no utiliza MapReduce cuando realiza ordenación, distribución y agrupación por (Impala no expone las características específicas de MapReduce de ORDENAR POR, DISTRIBUIR POR y CLUSTER BY).

Es posible que la cláusula FROM no sea necesaria en las consultas de Impala.

Impala admite un número limitado de conversiones de tipos implícitos. Esto evita comportamientos de conversión inesperados que conducen a resultados desconocidos.

Impala no realiza conversiones implícitas entre cadenas y números o valores booleanos.

Impala no realiza conversiones implícitas de números o cadenas a marcas de tiempo (impala realiza conversiones implícitas de tipos numéricos o cadenas a marcas de tiempo).

Impala no utiliza la zona horaria local para guardar marcas de tiempo para evitar resultados desconocidos causados ​​por exceder la zona horaria esperada. Las marcas de tiempo se almacenan en relación con GMT (hora media de Greenwich).

Al igual que los sistemas de bases de datos tradicionales, Impala no devuelve NULL para desbordamientos de columnas, por lo que los clientes pueden distinguir datos NULL de situaciones de desbordamiento. Impala devuelve el valor máximo o mínimo del tipo de datos. Por ejemplo, los valores válidos para tinyint oscilan entre -128 y 127. En Impala, establecer tinyint en -200 devuelve -128 en lugar de NULL. Establecer tinyint en 200 es en realidad 127.

Impala no proporciona columnas virtuales.

Impala No Impala Sin bloqueo de exposición.

Impala no expone algunas propiedades de configuración.