¿Puede Impala utilizar las funciones integradas de Hive?
Mecanismos de extensibilidad como conversiones, formatos de archivos personalizados o SerDes Zinpara 1.2 personalizados
Funciones XML y JSON
Algunas funciones agregadas en HiveQL: variance, var_pop, var_samp, stddev_pop, stddev_samp, covar_pop, covar_samp, corr, porcentaje, porcentaje_approximate, histogram_numeric, Collect_setImpala admite estas funciones agregadas: MAX(), MIN(), SUM(), AVG() , CONTAR().
Función de generación de tablas definida por el usuario (udtfs).
Muestreo
Vista lateral
Funciones de autorización como roles
Cada consulta dentro de una consulta tiene múltiples cláusulas diferentes.
Impala no admite actualmente estas declaraciones de HiveQL:
Tablas de análisis (hay estadísticas calculadas equivalentes en Impala)
Columnas de descripción
Describir base de datos
Exportar tabla
Importar tabla
Mostrar particiones
Mostrar tablas extendidas
Mostrar índices
p>Mostrar columnas
En muchos casos, las sentencias y cláusulas SQL similares utilizadas en Impala y Hive tienen una semántica diferente:
Impala usa una sintaxis y un nombre de solicitud de consulta diferentes. Consulte Conexión
Impala no utiliza MapReduce cuando realiza ordenación, distribución y agrupación por (Impala no expone las características específicas de MapReduce de ORDENAR POR, DISTRIBUIR POR y CLUSTER BY).
Es posible que la cláusula FROM no sea necesaria en las consultas de Impala.
Impala admite un número limitado de conversiones de tipos implícitos. Esto evita comportamientos de conversión inesperados que conducen a resultados desconocidos.
Impala no realiza conversiones implícitas entre cadenas y números o valores booleanos.
Impala no realiza conversiones implícitas de números o cadenas a marcas de tiempo (impala realiza conversiones implícitas de tipos numéricos o cadenas a marcas de tiempo).
Impala no utiliza la zona horaria local para guardar marcas de tiempo para evitar resultados desconocidos causados por exceder la zona horaria esperada. Las marcas de tiempo se almacenan en relación con GMT (hora media de Greenwich).
Al igual que los sistemas de bases de datos tradicionales, Impala no devuelve NULL para desbordamientos de columnas, por lo que los clientes pueden distinguir datos NULL de situaciones de desbordamiento. Impala devuelve el valor máximo o mínimo del tipo de datos. Por ejemplo, los valores válidos para tinyint oscilan entre -128 y 127. En Impala, establecer tinyint en -200 devuelve -128 en lugar de NULL. Establecer tinyint en 200 es en realidad 127.
Impala no proporciona columnas virtuales.
Impala No Impala Sin bloqueo de exposición.
Impala no expone algunas propiedades de configuración.