Red de conocimiento informático - Conocimiento del nombre de dominio - ¿Cuáles son las principales tecnologías para la integración de bases de datos heterogéneas?

¿Cuáles son las principales tecnologías para la integración de bases de datos heterogéneas?

CIMS es un sistema de aplicación informática integral, que consta de múltiples sistemas funcionales diferentes, como ERP, PDMS, etc. Estos sistemas pueden utilizar diferentes sistemas de bases de datos debido a diferentes objetos de datos. Además, las empresas generalmente tienen que pasar por varias etapas de desarrollo al implementar proyectos CIMS. Debido a razones técnicas o de mercado, los sistemas de bases de datos configurados en diferentes períodos pueden ser diferentes. De esta manera, el CIMS de una empresa incluirá inevitablemente varios sistemas de bases de datos diferentes. La diferencia mencionada aquí puede ser que DBMS se base en diferentes modelos de datos, como relacionales o basados ​​en objetos. También es posible que, aunque todos sean relacionales, las API de SQL de los productos de diferentes comerciantes sean diferentes. Estos son los problemas de integración de bases de datos heterogéneas que enfrenta CIMS. Las principales tecnologías para la integración de bases de datos heterogéneas son las siguientes:

1) Migración y conversión de datos

Utilizar programas de conversión de datos para convertir formatos de datos para que puedan ser recibidos por otros sistemas. Este método es sencillo de manejar y ha sido comprendido y aceptado por la mayoría de los usuarios. Muchos sistemas de gestión de bases de datos DBMS vienen con algunos programas de conversión de datos, que también brindan comodidad a los usuarios. Sin embargo, este método causará problemas de falta de sincronización cuando se actualicen los datos. Incluso si el programa de conversión se ejecuta manualmente con regularidad, solo puede lograr una sincronización a corto plazo. Esto no es adecuado para ocasiones en las que las actualizaciones de datos son frecuentes y reales. -Los requisitos de tiempo son altos.

 2) Utilizar middleware

Middleware (middleware) es un software de interfaz intermediario ubicado entre el Cliente y el Servidor. Es el pegamento necesario para la integración de sistemas heterogéneos. El middleware de bases de datos existente permite a los clientes llamar a servicios SQL en bases de datos heterogéneas para resolver el problema de interoperabilidad de bases de datos heterogéneas. El middleware de base de datos completamente funcional puede proteger a los usuarios de las diferencias en las ubicaciones de distribución de datos, plataformas DBMS, dialectos/extensiones SQL, API locales especiales, etc.

Existen varios métodos para la integración de bases de datos heterogéneas utilizando middleware:

(1) API SQL universal, es decir, todas las aplicaciones del lado del cliente utilizan la API SQL universal para acceder a la base de datos. y diferentes servidores DBMS proporcionan diferentes controladores de bases de datos para resolver problemas de conexión. La API de SQL general se puede dividir en SQL incorporado (ESQL - SQL incorporado) y SQL a nivel de llamada (CLI - Interfaz de capa de llamada). ESQL incorpora SQL en lenguajes de programación como C, Pascal y COBOL y lo procesa a través de programas precompilados. Por lo tanto, todas las funciones de SQL y sus características no procesales se heredan. CLI utiliza una API SQL invocable como interfaz de acceso a datos. No requiere un proceso de compilación previa y permite generar y ejecutar declaraciones SQL en tiempo de ejecución. Debido a que CLI es más flexible, ahora se usa ampliamente, como ODBC de Microsoft, DRDA de IBM, IDAPI de Borland, Open Client/Open Server de Sybase, etc. Fuente: www.examda.com

(2) Universal gateway Gateway es una solución de middleware actualmente popular. Hay un controlador de cliente público (controlador de puerta de enlace) en el lado del cliente; hay un aceptador de puerta de enlace en el lado del servidor, que captura la información de formato y protocolo (FAP) entrante, luego la convierte y la envía a la interfaz SQL nativa.

(3) Protocolo universal El protocolo universal se refiere a la FAP pública y la API pública, y tiene una única interfaz de administración de base de datos. La FAP disponible públicamente admite súper configuraciones que se aplican a todos los dialectos SQL o tolera todos los dialectos SQL nativos.

(4) Interfaz de acceso a datos consistente basada en tecnología de componentes. Por ejemplo, la tecnología UDA (Universal Data Access) lanzada por Microsoft proporciona una interfaz de programación a nivel de sistema de bajo nivel y una aplicación de alto nivel. interfaz de programación de nivel.

El primero define un conjunto de interfaces COM (Modelo de objetos componentes), establece el concepto de fuentes de datos abstractas, encapsula operaciones de acceso a varias fuentes de datos relacionales y no relacionales y establece estándares para usuarios y proveedores de datos. El primero proporciona un conjunto de objetos de automatización programables y es más adecuado para varios sistemas de aplicaciones cliente/servidor, especialmente para acceder a varias fuentes de datos en algunos lenguajes de secuencias de comandos.

3) Sistema de bases de datos múltiples

En el entorno CIMS, el método para resolver el problema de la integración de bases de datos heterogéneas en términos de sistema y escala es un sistema de bases de datos múltiples. El llamado sistema de bases de datos múltiples es un sistema que puede aceptar y acomodar múltiples bases de datos heterogéneas. Presenta una estructura integrada al mundo exterior y permite la "autonomía" de cada base de datos heterogénea internamente. Fuente: www.examda.com

Este sistema de bases de datos múltiples es diferente de un sistema de bases de datos distribuidas. No existe un software de sistema de administración de bases de datos unificado para sistemas de bases de datos múltiples, pero los sistemas de bases de datos distribuidas se ejecutan bajo la administración y el control de un software de sistema de administración de bases de datos unificado. Los sistemas de bases de datos múltiples adoptan principalmente un método de integración de datos de abajo hacia arriba, porque las situaciones heterogéneas son lo primero y luego los requisitos de integración adoptan principalmente un método de integración de datos de arriba hacia abajo. . Los sistemas de bases de datos múltiples resuelven principalmente el problema de la integración de bases de datos heterogéneas y pueden proteger los recursos de datos originales y permitir que cada base de datos local disfrute de un alto grado de "autonomía". Los sistemas de bases de datos distribuidas se centran en la distribución y alineación razonables de los datos bajo una planificación unificada. datos. La cuestión de la transparencia del usuario. Por supuesto, hay muchos cruces técnicos entre los dos y pueden aprender unos de otros. Los sistemas de bases de datos múltiples generalmente se dividen en dos categorías:

(1) Sistemas de bases de datos múltiples con un modelo unificado global. Al integrar múltiples bases de datos heterogéneas, existe un esquema conceptual unificado globalmente, que se obtiene mapeando el esquema conceptual de varias bases de datos locales heterogéneas.

(2) Sistema de base de datos federada. Solo existen relaciones de acoplamiento federadas flexibles entre varias bases de datos locales heterogéneas y no existe un modelo unificado global. Cada biblioteca local accede a los datos de las demás definiendo modos de entrada y salida. Hasta el momento, no existe ningún sistema de bases de datos múltiples comercializado y es difícil implementarlo en un entorno CIMS.