Red de conocimiento informático - Aprendizaje de programación - ¿Qué significa ETL?

¿Qué significa ETL?

ETL se refiere al proceso de tomar un flujo de big data sin procesar, analizarlo y producir un conjunto de datos de salida utilizable.

Extraer (E) datos de la fuente de datos y luego transformarlos (T) a través de varias agregaciones, funciones, combinaciones, etc., para convertirlos en datos utilizables. Finalmente, los datos se cargarán (L) en un entorno para su análisis específico. Este es el proceso ETL.

El texto completo es ?Extraer-Transformar-Cargar.

1. E: Extracción de datos

2. T: Transformación de conversión

3. Carga de carga

Información ampliada:

Función

ETL es una parte importante de la construcción de un almacén de datos. Los usuarios extraen los datos necesarios de la fuente de datos, los limpian y finalmente utilizan el modelo de almacén de datos predefinido. datos en el almacén de datos.

Tome las telecomunicaciones como ejemplo. El sistema A administra los datos de acuerdo con códigos estadísticos, el sistema B administra los datos de acuerdo con los números de cuenta y el sistema C administra los datos de acuerdo con la identificación de voz. Cuando ETL necesita integrar estos tres sistemas. Obtenga una visión integral de los clientes. Desde esta perspectiva, este proceso requiere reglas de coincidencia complejas, normalización y estandarización de nombres/direcciones, y ETL definirá un estándar de datos clave durante el procesamiento y, sobre esta base, formulará los estándares de interfaz de datos correspondientes.

Enciclopedia Baidu-ETL