Tres métodos de integración de datos
Tres métodos de integración de datos
Los métodos generales actuales de integración de datos se pueden resumir en federado, middleware, modelo de almacén de datos, etc. (1) Modelo de federación El sistema de integración de datos construido en este modelo se compone de la colaboración de múltiples sistemas de bases de datos autónomos, y cada fuente de datos proporciona una interfaz para el acceso mutuo. El sistema integrado de esta arquitectura integra vistas de datos de fuentes de datos heterogéneas en un patrón global. El esquema global describe la estructura de datos, la semántica y las operaciones de fuentes de datos heterogéneas. Es una vista de datos de una fuente de datos virtual y permite a los usuarios acceder a los datos de forma transparente. Los usuarios emiten solicitudes de acceso al sistema según el patrón global, y el sistema transforma estas solicitudes en operaciones que cada fuente de datos heterogénea puede realizar dentro del sistema autónomo. La construcción de la relación de mapeo entre el esquema global y las vistas de datos de fuentes heterogéneas y el procesamiento de solicitudes de consulta de los usuarios en el esquema global son dos cuestiones clave que deben resolverse en este modelo.
(2) Modo middleware En el sistema de integración de datos del modo middleware, el middleware generalmente se ubica entre la capa de datos y la capa de aplicación. Puede coordinar diferentes sistemas de bases de datos hacia abajo y puede coordinar diferentes sistemas de bases de datos hacia arriba. Las aplicaciones proporcionan una interfaz de acceso unificada y un modelo de datos. El sistema de middleware proporciona principalmente servicios de recuperación unificados para múltiples fuentes de datos heterogéneas en un entorno distribuido. La arquitectura del patrón de middleware suele consistir en una combinación de mediadores y envoltorios. Entre ellos, el mediador puede descomponer la consulta para el patrón global y generar subconsultas para diferentes fuentes de datos heterogéneas, que son ejecutadas por el contenedor. Una vez completada la consulta, los resultados de todas las subconsultas se resumen y se devuelven al usuario de forma unificada. formato: contenedor para diferentes fuentes de datos, que puede convertir datos heterogéneos en diferentes fuentes de datos en datos en formato unificado que pueden ser procesados por el sistema integrado (3) Modo de almacén de datos El almacén de datos está orientado a temas, está integrado y está relacionado con el tiempo. En la recopilación, los datos se clasifican en temas amplios, funcionalmente independientes y que no se superponen, un sistema utilizado para el análisis de datos y el apoyo a las decisiones, y también propone un método de integración de datos para aplicaciones empresariales. Este modelo utiliza un método para almacenar copias de múltiples fuentes de datos heterogéneas en un único almacén de datos. Las herramientas ETL (Extract, Transform, Load) extraen y transforman periódicamente datos de diferentes fuentes de datos y luego los cargan en un almacén de datos. El sistema de gestión se construye sobre la base del almacén de datos para manejar las solicitudes de acceso a datos de los usuarios.