¿Qué es "etl"?
El almacén de datos es una colección estratégica que proporciona diversos datos de soporte para el proceso de toma de decisiones en todos los niveles de la empresa. Es un almacén de datos independiente que se utiliza para informes analíticos y soporte de decisiones. Proporciona orientación sobre la mejora de los procesos de negocio, el seguimiento del tiempo, los costos, la calidad y el control para las empresas que necesitan inteligencia de negocios.
ETL es el proceso de cargar datos de los sistemas empresariales en el almacén de datos después de extraerlos, limpiarlos y convertirlos. Su propósito es integrar datos dispersos, desordenados y no unificados en la empresa para proporcionar una base analítica para la toma de decisiones corporativas. ETL es una parte importante de los proyectos de inteligencia empresarial.
Datos extendidos:
ETL y ELT:
El proceso descrito por ETL generalmente incluye ETL o ELT (Extract-Load-Transform), que son mixtos. Generalmente, cuanto mayor es la cantidad de datos, más compleja es la lógica de conversión y mayor es la potencia informática de la base de datos de destino, es más probable que se utilice ELT para aprovechar las capacidades de procesamiento paralelo de la base de datos de destino.
El proceso de ETL (o ELT) se puede desarrollar en cualquier lenguaje de programación. Dado que ETL es un proceso extremadamente complejo y los programas escritos a mano no son fáciles de administrar, cada vez más empresas utilizan herramientas para ayudar al desarrollo de ETL y utilizan sus funciones de metadatos integradas para almacenar el mapeo entre fuentes y destinos, así como reglas de transformación. .
Las herramientas pueden proporcionar una potente conectividad entre fuentes y destinos, lo que permite a los desarrolladores desarrollar sin estar familiarizados con diferentes plataformas y estructuras de datos. Por supuesto, estos beneficios tienen un costo monetario.