Análisis de aplicaciones XML
Du Fudian
(Centro de Información sobre Tierras, Medio Ambiente y Recursos de la Provincia de Hainan, Haikou, 570206)
Resumen: El intercambio de datos existe en "ingeniería de metales y tierras" relacionado En la transmisión de sistemas, datos e información de superior a subordinado, XML se utiliza como la forma básica de intercambio de datos, que puede resolver la seguridad, confiabilidad, flexibilidad y apertura del intercambio de datos, y proporcionar un intercambio de datos simple y eficiente para al estilo de la "ingeniería de metales y tierras".
Palabras clave: "Ingeniería del Oro y la Tierra"; XML; intercambio de datos; bus de datos
"Ingeniería del Oro y la Tierra" es el proyecto marco del Edificio de Información sobre Tierras y Recursos, y el Uno de los contenidos centrales es que debido a las cuestiones heterogéneas involucradas en el contenido de los datos, los tipos de datos y los formatos de datos involucrados en la "ingeniería del metal y la tierra", el intercambio de datos debe ser una parte indispensable de la "ingeniería del metal y la tierra". ingeniería". El método de bus de datos basado en tecnología XML proporcionará acoplamiento flexible, código claro, límites claros, escalabilidad, facilidad de mantenimiento y apertura para el intercambio de sistemas, datos, superiores y subordinados, e incluso sistemas y datos internos en la "Tierra Dorada". Ingeniería" Una plataforma de intercambio de datos integral y unificada.
1 El sistema de intercambio de datos de "Golden Earth Engineering"
"Golden Earth Engineering" adoptará una arquitectura técnica orientada a servicios e ideas de plataforma de gobierno electrónico, enfatizando la practicidad y versatilidad de tecnología, confiabilidad y seguridad, asegurando la escalabilidad, facilidad de mantenimiento, apertura y unidad del sistema.
En términos de construcción de recursos de datos, las principales plataformas SIG, bases de datos orientadas a objetos y otras tecnologías se utilizan para construir e integrar varias bases de datos de acuerdo con estándares unificados, mediante una combinación de gestión centralizada y distribuida, multi- nivel de copia de seguridad y relativa independencia. El mecanismo de gestión de datos realiza la gestión y el mantenimiento unificados de los datos.
En términos de construcción del sistema de aplicaciones, haremos planes generales y construiremos un sistema de aplicaciones comerciales de tierras y recursos a través de la plataforma de gobierno electrónico.
Los datos deben intercambiarse dentro o entre recursos de datos y sistemas de aplicaciones para formar un sistema de intercambio de datos. El sistema de intercambio de datos incluye un sistema de intercambio para la sincronización y copia de seguridad básica de bases de datos, un sistema de intercambio para la transmisión de información comercial en todos los niveles, un sistema de intercambio para compartir datos externos e incluso para el intercambio de datos entre módulos internos del sistema.
Un sistema de conmutación para sincronización y copia de seguridad de bases de datos básicas, que realiza principalmente la sincronización oportuna y automática de actualizaciones desde bases de datos de nivel inferior a bases de datos de nivel superior.
El sistema de intercambio está orientado a la transmisión de información comercial en todos los niveles. Se utiliza principalmente para realizar el intercambio de datos comerciales, informes de datos estadísticos, informes o distribución de materiales, etc. entre los procesos comerciales superiores e inferiores. del sistema empresarial vertical.
Un sistema de intercambio para el intercambio de datos externos, que realiza principalmente el intercambio de datos comerciales relacionados con datos básicos entre el sistema de tierras y recursos y los departamentos externos.
Para el intercambio de datos entre módulos dentro del sistema, realiza principalmente el intercambio de datos durante el cálculo y procesamiento de datos entre módulos.
El sistema de intercambio de datos debe abordar la seguridad, confiabilidad, flexibilidad y apertura del intercambio de datos. Usar la tecnología XML como base del sistema de intercambio de datos "Gold and Earth Engineering" es una mejor opción.
2 Desarrollo y características de XML
2.1 Desarrollo de XML
Hasta el momento, una proporción considerable de páginas Web están escritas en HTML. HTML es fácil de aprender y versátil, con una sintaxis concisa y compacta, junto con sus funciones ampliadas como tablas, marcos, scripts, etc., lo que lo hace muy útil en las páginas de inicio web. Sin embargo, a medida que las aplicaciones web se generalizan cada vez más, la debilidad de la simplicidad del HTML se ha vuelto cada vez más evidente.
(1) El enlace no se puede corregir automáticamente una vez perdido. Dado que las direcciones URL de muchas páginas cambian con frecuencia, encontrará molestos mensajes de dirección URL 404 no encontrada cuando navegue por estas páginas. Debe cambiar manualmente las direcciones URL que enlazan a páginas relacionadas una por una, lo que aumenta considerablemente la carga de trabajo de mantenimiento de las páginas web.
(2) Hay demasiados componentes que deben descargarse para contenido dinámico. Las páginas creadas con HTML actualmente no pueden actualizar los atributos de apariencia de la página, como el color, la fuente, el fondo, etc. Sólo puede volver a descargar una nueva página o un widget de Java. Pero los datos guardados por Java son inaccesibles para los motores de búsqueda, por lo que usar Java para mostrar contenido dinámico en páginas HTML no es una panacea.
(3) Tiempo de búsqueda prolongado Dado que las páginas HTML no tienen una estructura similar a una base de datos, al buscar un objetivo en dichos documentos, es necesario escanear todo el contenido de todas las páginas, a menudo recuperando un Muchas palabras clave relacionadas con el tema. Contenido irrelevante, esto se debe a la incapacidad de HTML para distinguir entre información y metainformación. Y HTML no admite la arquitectura de anidamiento de información, lo que limita las capacidades de búsqueda de texto completo.
(4) HTML no admite caracteres de doble byte o multinacionales, o el soporte es insuficiente. Por ejemplo, las páginas de información chinas pueden tener problemas como un formato desigual en diferentes plataformas.
(5) HTML tiene poca escalabilidad. Los científicos no pueden utilizar HTML para escribir fórmulas matemáticas, ecuaciones químicas y estructuras cristalinas moleculares.
Para solucionar estas deficiencias, surgió Extensible Markup Language - Lenguaje de marcado extensible, o XML para abreviar.
En febrero de 1998, el World Wide Web Consortium (W3C) lanzó el estándar XML1.0. XML es un lenguaje de metaanotación que proporciona un formato para describir datos estructurados y está definido por el W3C para su optimización. Subconjunto de SGML (Estándar de lenguaje de marcado general ISO 8879:1986) para el transporte a través de la Web, XML garantiza que los datos estructurados sean consistentes e independientes de las aplicaciones o proveedores, y pueden codificar contenido en una variedad de situaciones (desde simples hasta complejas). Estándares de datos semánticos y arquitectónicos.
2.2 Características de XML
Desde su aparición, XML ha sido aclamado como una poderosa herramienta para el proceso de estandarización de la información debido a sus ventajas como estandarización, protocolo de interfaz, simplificación y encapsulación. Estándares basados en XML Se convertirán en la corriente principal de los estándares de información en el futuro.
2.2.1 Estandarización
En comparación con otras tecnologías de servicios, la estandarización es una de las características de XML. XML proporciona un formato estándar para transferir datos entre sistemas. El World Wide Web Consortium (W3C) gestiona los estándares XML y los publica para proveedores de tecnología XML de todo el mundo, lo que garantiza la compatibilidad de los productos XML. Además de los motores y productos XML, existen gramáticas XML. Cada sintaxis XML es un método estándar para formatear datos en un área problemática específica. Siguiendo y adoptando la sintaxis XML, cualquiera puede estandarizar el formato de datos para la comunicación entre dos sistemas de aplicaciones.
2.2.2 Protocolo de interfaz
Cuando se programa una interfaz, a menudo se le llama protocolo. Desde una perspectiva de programación, las interfaces proporcionan una estructura de programación sin exponer la implementación. XML tiene características similares si utiliza DTD (definiciones de tipo de documento) y esquemas. Tanto las DTD como los esquemas se utilizan para describir la estructura de los documentos XML y las reglas para crear documentos XML. Se pueden utilizar una (o más) DTD (o esquemas) relacionados para organizar dicho conjunto de reglas, lo que se denomina gramática XML.
La gramática XML no sólo se puede utilizar para estandarizar la comunicación entre aplicaciones, sino también para proporcionar un protocolo de interfaz para los desarrolladores. En otras palabras, los desarrolladores no necesitan saber cómo se implementa el documento (es decir, el documento XML real) al crear una aplicación que necesita utilizar la estructura de un documento XML. La DTD y el esquema describen la estructura del documento y se pueden utilizar como protocolo de interfaz para el desarrollo. Cualquier cambio en la DTD también cambia el protocolo.
2.2.3 Simplificación
Otro aspecto importante de un documento XML es su naturaleza simplificadora, sino más bien la simplicidad de los conceptos XML y los métodos generales.
Por ejemplo, XML se basa en documentos de texto, lo que simplifica el proceso de abrir un documento XML y ver su contenido.
También es importante simplificar el modelo de servicio web utilizando XML. Los servicios web son inherentemente más complejos que XML por sí solo. Suponiendo que XML y CORBA sean igualmente complejos, y que otras tecnologías de servicios web sean igualmente complejas, las tecnologías de servicios web pueden volverse muy difíciles de manejar. Sin embargo, mediante el uso de métodos de bloques de construcción simples, como XML, SOAP, etc., la complejidad de los servicios web se puede controlar dentro de un rango tolerable, de modo que las aplicaciones creadas con ellos no serán difíciles de controlar.
2.2.4 Encapsulación
La encapsulación es una de las características de XML, especialmente a la hora de desarrollar servicios Web. Básicamente, la encapsulación se refiere al concepto de tomar uno o más fragmentos de datos y combinarlos en un objeto simple (en lugar de varios objetos independientes). La encapsulación es similar a una agregación, pero hay una diferencia importante: la encapsulación generalmente significa que no tiene dependencias externas.
Es posible crear documentos XML con dependencias externas, pero en un modelo de servicios web transaccionales, es más sensato utilizar la encapsulación. Al diseñar una solución XML que englobe las dependencias, generalmente se pueden eliminar los problemas con el procesamiento de transacciones. Especialmente en situaciones donde los datos externos cambian con frecuencia, forzar que los datos externos se ubiquen dentro de una transacción y sean consistentes con los datos XML puede ser perjudicial. Si encapsula los datos en gramática XML, puede obtener los datos correctos.
3 Análisis de aplicaciones de bus de datos XML
3.1 XML construye un bus para el intercambio de datos de "ingeniería de metales y tierras"
Varios sistemas y niveles de "metal e ingeniería terrestre" El intercambio de datos entre ellos se realiza a través de la tecnología de bus de datos XML abierto. El bus de datos XML consta de cuatro partes: publicación, integración, distribución y automatización, como se muestra en la siguiente figura.
Diagrama del bus de datos XML
El bus de datos de publicación es un intercambio de datos que muestra el mismo contenido de datos en diferentes formas en el cliente según las diferentes necesidades del usuario. La visualización de datos y el contenido se separan mediante el método del bus de datos. Los datos definidos por XML permiten especificar diferentes métodos de visualización para que los datos sean más razonables. XML complementaba a HTML y se utilizaba cada vez más para describir interfaces de usuario, formando la idea de que HTML describe la apariencia de los datos, mientras que XML describe los datos en sí.
Los datos locales se pueden mostrar dinámicamente de una manera determinada por la configuración del cliente, la selección del usuario u otros estándares. CSS y XSL proporcionan un mecanismo de publicación para la visualización de datos. Con XML, los datos se pueden actualizar de forma granular. Siempre que una parte de los datos cambie, no es necesario reenviar todos los datos estructurados. Los elementos modificados deben enviarse desde el servidor al cliente y los datos modificados se pueden mostrar sin actualizar toda la interfaz de usuario. Se ha cambiado el método HTML. Siempre que cambie un dato, se debe reconstruir toda la página, lo que limita seriamente el rendimiento del servidor.
Además, los datos publicados a través del método de bus XML también permiten que se agreguen otros datos. Los datos agregados pueden ingresar a la página existente sin la necesidad de que el navegador vuelva a enviar una nueva página.
El bus de datos integrado es el intercambio de datos entre dos o más bases de datos heterogéneas entre sistemas.
Los sistemas interactúan con estas bases de datos, que tienen diferentes formatos complejos, a través del lenguaje estándar XML. Esto se debe a la personalización y extensibilidad del XML, lo que lo hace suficiente para expresar varios tipos de datos. Una vez que el sistema recibe los datos, puede procesarlos o transferirlos entre diferentes bases de datos. XML resuelve el problema de una interfaz unificada para el intercambio de datos.
XML proporciona al sistema una potente funcionalidad y flexibilidad. Por ejemplo, realice búsquedas más significativas y los datos se identificarán de forma única mediante XML.
Sin XML, las herramientas de búsqueda tendrían que entender cómo está estructurada cada base de datos, lo cual es prácticamente imposible porque el formato en el que cada base de datos describe sus datos es casi siempre diferente. Buscar en diversas bases de datos incompatibles ahora es prácticamente imposible debido a problemas de integración con datos de fuentes dispares. A través del bus de datos XML, los datos estructurados de diferentes fuentes se pueden integrar fácilmente en el servidor de nivel medio y luego enviar los datos al cliente u otros servidores. para su posterior recopilación, procesamiento y distribución para lograr el intercambio de datos entre bases de datos.
Los datos distribuidos son un método de intercambio de datos que transfiere la mayor parte de la carga de procesamiento del servidor al cliente a través del bus de datos.
Los clientes pueden elegir y crear diferentes sistemas de aplicaciones para procesar datos según sus propias necesidades, y el servidor solo necesita emitir el mismo archivo XML. Por ejemplo, según el método de trabajo tradicional "Cliente/Servidor", el cliente envía diferentes solicitudes al servidor y el servidor responde respectivamente. Esto no sólo aumenta la carga en el servidor en sí, sino que también el administrador de la red debe investigar a varios usuarios. Se pueden desarrollar diferentes programas en consecuencia, pero si las necesidades del usuario son complejas y cambiantes, no es apropiado concentrar toda la lógica empresarial en el lado del servidor, porque es posible que el sistema de servicio del lado del servidor no tenga tiempo para hacerlo. Para satisfacer las numerosas necesidades de las aplicaciones o mantenerse al día con los cambios, ambas partes son muy pasivas. La aplicación del bus de datos XML le da la iniciativa de procesar datos al cliente. Lo que hace el servidor es encapsular los datos en archivos XML de la manera más completa y precisa posible para intercambiarlos a través del bus, de modo que todos obtengan lo que necesitan y realicen sus tareas. deberes. . La naturaleza autoexplicativa de XML se utiliza para permitir que el cliente comprenda la estructura lógica y el significado de los datos mientras los recibe, ampliando así una amplia gama de métodos informáticos distribuidos generales.
El bus de datos automatizado sigue el mismo estándar de intercambio de datos, permitiendo que la aplicación tenga ciertas capacidades de procesamiento automático, de modo que la información obtenida pueda editarse, agregarse o restarse para adaptarse a las necesidades del usuario, de esta manera. para mejorar la eficiencia del trabajo. Los pasos para desarrollar un programa de agente inteligente típico para aplicaciones de gestión de tierras y recursos son los siguientes: ① El programa envía una solicitud de actualización de datos al sistema de intercambio de datos del departamento de gestión de tierras y recursos de nivel inferior. Después de recibir la respuesta, automáticamente. conecta todas las ubicaciones proporcionadas en la respuesta ②Busque información sobre los datos programados y compare la información obtenida de diferentes sitios para este contenido de acuerdo con ciertas reglas ③Obtenga los resultados requeridos e infórmelos automáticamente al departamento de gestión de tierras y recursos en el sitio Enviar; notificación de actualizaciones de datos.
3.2 Características del bus de datos XML
3.2.1 Seguridad del intercambio de datos
En el diseño del centro de intercambio de datos se utilizan documentos XML como base para el intercambio de datos. Ahora existen métodos muy maduros para el cifrado de documentos, por lo que todo el documento XML se puede cifrar y enviar de forma segura a uno o más destinatarios después de la autenticación de firma digital. El destinatario de los datos puede luego descifrar el documento de datos XML después de recibirlo.
3.2.2 Confiabilidad del sistema
En el diseño del centro de intercambio de datos, considere que todo el centro de intercambio de datos existe como un componente de servicio de aplicación independiente en la información del departamento de gestión de tierras y recursos. entorno del sistema sin depender de ningún sistema de información independiente, el sistema no se verá afectado por fallas inesperadas del sistema de información.
El centro de intercambio está separado de la base de datos, es decir, en circunstancias normales, el centro de intercambio de datos no interopera con la base de datos de ningún sistema de información u otro sistema profesional, y todo el procesamiento de datos se realiza a través del titular de los datos y trato con el solicitante. Este método de diseño no solo garantiza la independencia y seguridad de cada sistema, sino que también garantiza la interactividad entre sistemas.
El centro de intercambio de datos existe en el entorno del servidor de aplicaciones. Puede utilizar las funciones dinámicas de equilibrio de carga y recuperación de fallas proporcionadas por el entorno del servidor de aplicaciones para garantizar el funcionamiento confiable a largo plazo del centro de intercambio de datos.
3.2.3 Flexibilidad del sistema
El centro de intercambio de datos proporciona dos métodos de intercambio de datos: intercambio de datos basado en mensajes y lectura y escritura directa de datos por parte del centro de intercambio de datos para adaptarse a diversas necesidades. entorno del sistema.
El método de intercambio de datos basado en mensajes es el método preferido del centro de intercambio de datos. En este método, el centro de intercambio de datos realiza un intercambio de datos asíncrono con sistemas que admiten el método del mecanismo de mensajes. El iniciador del intercambio de datos envía el mensaje en formato XML al centro de intercambio de datos y luego continúa realizando otras tareas hasta que recibe el mensaje de finalización del intercambio de datos del centro de intercambio de datos y luego procesa los datos requeridos. En el modo de intercambio de datos basado en mensajes, el centro de intercambio de datos gestiona todo el proceso del mensaje para garantizar la secuencia de recepción del mensaje y la precisión de los datos.
El centro de intercambio de datos también proporciona un método de intercambio de datos en el que los datos son leídos directamente por el centro de intercambio de datos. En este método, el centro de intercambio de datos interactúa principalmente con sistemas que proporcionan datos pasivamente. para proporcionar datos. No se requieren datos y la estructura del sistema es relativamente simple.
3.2.4 Apertura del sistema
El centro de intercambio de datos proporciona API de control de mensajes y herramientas de personalización del protocolo de conversión de datos al mundo exterior, de modo que cualquier sistema pueda acudir al intercambio de datos. centro a través de las herramientas de personalización del protocolo de conversión de datos Al agregar un protocolo de conversión de datos, puede utilizar la API de control de mensajes proporcionada por el centro de intercambio de datos para intercambiar datos con el centro de intercambio de datos.
Debido a que el estándar XML es extensible y tiene una fuerte función de autodescripción, ha mejorado el método tradicional de representación de datos. No solo es muy adecuado para el intercambio de datos y la divulgación de información, sino que también se convertirá cada vez más en el método. base para visualización, indexación, etc. Base. Las bases de datos actuales básicamente proporcionan herramientas de conversión XML, por lo que los documentos XML son muy adecuados para el intercambio de datos en "ingeniería de metales" entre sistemas y plataformas. Con la aparición de XML como forma estándar de intercambio de datos, las aplicaciones basadas en XML se basarán en él. ser más simple y más eficiente.
>
[2]Won Kim, Ki-Joon Chae. “Arquitectura de ingeniería del conocimiento basada en componentes, JOOP, 1999
[3]Ritter, D. El eslabón perdido para D2B E. -Comercio Empresa inteligente, 1999
[4] Gao Bo, Wang Yan, Ben Chang. Oracle, Manual de desarrollo de XML, Beijing: Machinery Industry Press, 2001
[5] XML Foro de China. "Tutorial práctico avanzado de XML". Beijing: Tsinghua University Press, 2001
[6] Wang Zhong, Chen Xiaoou Investigación sobre tecnología de acceso e intercambio de datos, 2001.
p>[7] Xu Tianxin, Jin Ye, Li Liuling. Diseño e implementación de un sistema Web-EDI simétrico basado en XML, Computer Integrated Manufacturing System-CIMS, 2001
[ 8] He Rong, Fang Xuming. Diseño de canal de procesamiento de pedidos de comercio electrónico basado en aplicaciones informáticas, 2002
.