Análisis de tendencias de desarrollo de tecnología XML y bases de datos.
La tecnología de bases de datos y sus sistemas de aplicación han experimentado el desarrollo desde bases de datos jerárquicas, bases de datos en red hasta bases de datos relacionales y bases de datos orientadas a objetos, y han madurado gradualmente en los campos tradicionales de procesamiento de transacciones y negocios, reemplazando el sistema de archivos original. Los métodos de procesamiento de datos se han convertido en una base y un pilar importante en los sistemas de información informática. Sin embargo, con el rápido desarrollo de Internet, la aparición de la Web ha cambiado los métodos de procesamiento habituales de las personas y ha planteado cuestiones importantes que deben afrontar las bases de datos. tecnología, es decir, cómo almacenar y administrar eficazmente la Web. Los datos (documentos) en Internet se pueden operar y mantener de manera eficiente y se pueden expresar e intercambiar convenientemente en la plataforma de Internet.
La tecnología XML se ha desarrollado muy rápidamente. desde su aparición y ha sido ampliamente apoyado en muchos campos y tiene amplias perspectivas de aplicación, como el intercambio electrónico de datos, el comercio electrónico, etc. XML se considera una tecnología pilar básica
Una breve historia de bases de datos
Los sistemas de bases de datos están siguiendo el El desarrollo continuo de la tecnología informática surgió bajo entornos de demanda específicos en períodos históricos específicos Desde la primera computadora en 2000 hasta la década de 2000, los sistemas operativos se limitaban principalmente a operaciones de archivos y. La gestión de datos se realizó principalmente a través de archivos. El sistema se da cuenta de que varios datos necesarios para el cálculo se almacenan en sus propios archivos. Cuando se utilizan estos datos, el archivo se abre y los datos del archivo se leen en la memoria. los resultados del cálculo todavía se escriben en el archivo para eliminar sus deficiencias. Centrado principalmente en la incapacidad de una gestión unificada eficaz de los datos, en vista de las importantes deficiencias del sistema de archivos, la gente desarrolló gradualmente un sistema con las principales características de gestión unificada. intercambio de datos, es decir, un sistema de base de datos IDS (Integrated Data Store) IDS sentó las bases para la base de datos en red y se distribuyó y aplicó ampliamente. Se convirtió en un monumento en la historia del desarrollo de sistemas de bases de datos. , la International Business Machines Corporation (IBM) de Estados Unidos también lanzó el primer sistema de base de datos jerárquico IMS (Sistema de gestión de información) del mundo que también ocupa una posición importante en la historia del desarrollo de sistemas de bases de datos.
A principios de la década de 1990, E F Codd propuso el concepto de modelo de datos relacionales y, basándose en resumir las ventajas y desventajas de las bases de datos de redes jerárquicas anteriores, el álgebra relacional y el cálculo relacional han logrado resultados fructíferos en los sistemas de bases de datos relacionales, tanto en teoría como en la práctica. La teoría del modelo se ha establecido. La teoría de la dependencia de datos y la teoría del diseño de bases de datos relacionales han surgido en la práctica en muchos lugares del mundo. Los sistemas de bases de datos relacionales más famosos, como SystemR INGRES, etc. p>
En comparación con los sistemas de archivos, los sistemas de bases de datos tienen varias características para proporcionar a los usuarios interfaces avanzadas y proporcionar a los usuarios restricciones de integridad de datos de control de concurrencia de optimización y procesamiento de consultas de lenguaje de base de datos procedimental (es decir, lenguaje SQL)
La rápida mejora de la tecnología de hardware informático después de ingresar a la década de 1990 ha impulsado la profundización continua de las aplicaciones informáticas y la creación de muchos campos de aplicación nuevos, por ejemplo, diseño asistido por computadora, fabricación asistida por computadora, enseñanza asistida por computadora, automatización de oficinas e inteligencia. El procesamiento de información, el apoyo a las decisiones y otros campos nuevos han planteado nuevos requisitos para los sistemas de bases de datos. Sin embargo, debido a la diversificación de las aplicaciones, no se puede diseñar un modelo de datos unificado para representar estos nuevos tipos de datos. de pensamiento, lo que resultó en la investigación y aplicación de nuevas bases de datos como bases de datos deductivas, bases de datos orientadas a objetos, bases de datos distribuidas, bases de datos de ingeniería, bases de datos temporales y bases de datos difusas
Introducción a XML
La edición estándar recomendada por XML se lanzó en 2009 y rápidamente desencadenó una ola de aplicaciones XML en todo el mundo. XML es un lenguaje de marcado descriptivo y es una aplicación de SGML (estándar internacional ISO de lenguaje de marcado general estándar). en escalabilidad, portabilidad y estructura su alcance de aplicación supera el alcance logrado por HTML
Un documento XML se compone de etiquetas y contenido. Hay seis tipos de etiquetas en XML.
Elementos Atributos Entityreferences Comentarios Instrucciones de procesamiento y secciones CDATA La diferencia más significativa entre XML y HTML es la introducción de Declaraciones de Tipo de Documento DTD en documentos XML. La aparición de DTD permite que el documento comunique metainformación sobre su contenido con el analizador XML. Escalabilidad, estructura y verificabilidad de los documentos. Le da a XML algunas propiedades similares a las bases de datos. XML puede usarse para organizar y administrar información Convenientemente representado en el navegador como HTML y transmitido e intercambiado de manera eficiente en Internet. no es un componente necesario del documento XML. Un documento XML con una DTD se llama Válido; de lo contrario, se forma.
Actualmente, existen dos formas principales de procesar documentos XML: SAX y DOM (SimpleAPI para. Model) es construir una estructura de árbol completa en la memoria después de analizar el documento XML y luego realizar varias operaciones sobre esta base. Una comparación simple muestra que SAX tiene bajos requisitos de recursos del sistema y es rápido, pero la operación del documento es única. El poder de procesamiento de la lectura DOM es poderoso, pero requiere muchos recursos del sistema, especialmente para documentos grandes. Luego aparecieron Xpath y Xpointer para completar la búsqueda y conversión XML. XSLT y SOAP se utilizaron para completar el acceso a objetos XML remotos. Idiomas La aparición del lenguaje de consulta XML se puede utilizar para cualquier documento XML
XML proporciona muchas herramientas que tienen las bases de datos: esquemas de almacenamiento (documentos XML) (DTD XMLschema RE AXNG, etc.) lenguajes de consulta (XQuery XPath XQL XML QL QUILT, etc.) interfaces de programación (SAX DOM JDOM), etc. Sin embargo, XML no puede reemplazar completamente la tecnología de base de datos XML. Carece de las características que debería tener una base de datos práctica: índice de almacenamiento eficiente y mecanismo de modificación de datos, estricta seguridad de los datos. control, control completo de transacciones y consistencia de datos, mecanismo de acceso multiusuario, disparadores, control de concurrencia perfecto, etc. Por lo tanto, incluso si la cantidad de datos es pequeña y hay pocos usuarios, los documentos XML se pueden utilizar como bases de datos en entornos con baja requisitos de rendimiento, pero no son adecuados para entornos operativos con una gran cantidad de usuarios, alta integración de datos y requisitos de alto rendimiento
Con el desarrollo continuo de la tecnología web, la información El alcance del intercambio y el intercambio de datos continúa Las bases de datos relacionales tradicionales también enfrentan desafíos. La aplicación de la tecnología de bases de datos se basa en la heterogeneidad entre los sistemas de gestión de bases de datos y la heterogeneidad de los sistemas operativos en los que dependen. La capacidad de descripción semántica de la tecnología de bases de datos es deficiente. La mayoría de ellos se expresan a través de documentos técnicos. Es difícil lograr la persistencia y entrega de la semántica de datos. Sin embargo, el intercambio de datos y el intercambio de información se basan en la semántica. No es propicio para que las computadoras recuperen y apliquen automáticamente datos correctos basados en la semántica. Las bases de datos son aplicaciones de alta gama que requieren precios y entornos operativos costosos. Con el desarrollo de las redes e Internet, la capacidad de intercambiar datos se ha convertido en una nueva aplicación. Un requisito importante del sistema es que el beneficio de XML es la capacidad de intercambio de datos (portátil). Al mismo tiempo, también tiene las siguientes ventajas en aplicaciones de datos () Los archivos XML son archivos de texto sin formato y no están restringidos por las plataformas de software del sistema operativo. () XML tiene función automática basada en esquemas para describir la semántica, lo que facilita la descripción de la semántica de los datos. Esta descripción puede ser entendida y procesada automáticamente por las computadoras () XML no solo puede describir datos estructurados.
También puede describir eficazmente datos semiestructurados o incluso no estructurados
Almacenamiento de archivos XML
Hay tres categorías principales de métodos de almacenamiento para archivos XML (Almacenamiento de documentos en el sistema de archivos). () Almacene documentos en BLOB (almacenamiento de documentos en BLOB), aprovechando la gestión de transacciones de la base de datos, el acceso seguro de múltiples usuarios, etc. Además, muchas bases de datos relacionales proporcionan herramientas de búsqueda que pueden realizar búsquedas de texto completo, búsquedas aproximadas y búsquedas de sinónimos. y búsqueda difusa, algunas de las cuales Soporte para XML Esto elimina los problemas causados por la recuperación de archivos XML como texto sin formato ( ) Almacena archivos en bases de datos XML nativas (Native XML Databases NXD) NXD es una base de datos dedicada a almacenar archivos XML Soporta gestión de transacciones Segura programación de acceso multiusuario La única diferencia entre la API y el lenguaje de consulta y otras bases de datos es que su modelo interno se basa en XML. El método de almacenamiento más importante es sin duda la base de datos XML nativa
Base de datos XML nativa
. p>La base de datos XML nativa (NativeXMLDatabases) define un modelo (lógico) para documentos XML y accede a archivos de acuerdo con este modelo. Este modelo debe incluir al menos atributos de elementos PCDATA y orden de archivos. Los ejemplos incluyen el modelo de datos XPath XMLIn foset y. el modelo utilizado por los eventos DOM y SAX. Como unidad de almacenamiento básica, los archivos XML no tienen requisitos especiales para el modelo de almacenamiento físico subyacente. Por ejemplo, se puede construir sobre una base de datos relacional jerárquica u orientada a objetos o utilizar una base de datos dedicada. formato de almacenamiento como un índice o un archivo comprimido
NXD es el más adecuado para almacenar archivos centrados en documentos. Esto se debe a que NXD conserva instrucciones de procesamiento de secuencia de archivos, comentarios, CDA, bloques TA, referencias de entidades, etc. mientras que la base de datos XED (base de datos habilitada para XML) que admite XML no puede hacer esto. XED es una extensión de la base de datos original. El módulo de soporte XML completa la conversión de formato y la transmisión entre los datos XML y la base de datos. se puede utilizar como una fila en la tabla RDBMS o el documento XML se puede analizar y almacenar en la tabla correspondiente. Para admitir algunas operaciones XML del estándar WC Xpath, XED proporciona algunas primitivas nuevas (como Oracle iR que agrega algunos paquetes de datos). operar datos XML, etc.) y optimiza el módulo de procesamiento XML
NXD generalmente utiliza un modelo de almacenamiento de datos jerárquico para mantener la forma de árbol de los documentos XML. La estructura elimina el proceso de conversión de datos de los documentos XML y las bases de datos tradicionales. NXD también es adecuado para almacenar archivos cuyo formato nativo es XML. NXD también puede almacenar datos semiestructurados para mejorar la velocidad de acceso en determinadas circunstancias y almacenar archivos sin DTD (bueno (archivo estructurado)
La estructura del nativo. Base de datos XML
La estructura de la base de datos XML nativa se puede dividir en dos categorías: basada en texto y basada en modelos
Las NXD (bases de datos nativas XML basadas en texto) basadas en texto almacenan XML como texto. Puede ser un archivo en un sistema de archivos, un BLOB en una base de datos relacional o un formato de archivo específico. NXD basado en texto es muy similar a una base de datos jerárquica cuando se accede a datos jerárquicos predefinidos. En las bases de datos, NXD también encuentra problemas al acceder a datos en otras formas, como la transposición de la jerarquía, aún no se conoce el alcance de este problema. Muchas bases de datos relacionales utilizan punteros lógicos para lograr la misma complejidad. p>
NXD basado en modelos (Model BasedNativeXMLDatabases) construye un modelo interno basado en el archivo y almacena el modelo. Algunas bases de datos almacenan el modelo en bases de datos relacionales y orientadas a objetos. Por ejemplo, en bases de datos relacionales. base de datos, habrá tablas como atributos de elementos, PCDATA, referencias de entidades, etc. Otras bases de datos utilizan formatos de almacenamiento optimizados para este modelo.
NXD basado en modelos, que utiliza un formato de almacenamiento dedicado, funciona de manera similar a NXD basado en texto si lee archivos en el orden en que están almacenados
Características de las bases de datos XML nativas
Características de las bases de datos XML nativas Las características de las Bases de Datos NativeXML incluyen ( ) Colecciones de Documentos, que soportan el concepto de colecciones, que funcionan de manera equivalente a tablas en bases de datos relacionales y carpetas en sistemas de archivos ( ) Lenguajes de Consulta (Query Languages) Los más utilizados. Algunos son XPath (consulta ampliada para múltiples archivos) y XQL y lenguaje de consulta propietario (Actualizaciones y eliminaciones). NXD actualiza y elimina archivos, desde simplemente reemplazar o eliminar archivos existentes hasta modificar las actividades actuales. El árbol DOM y el lenguaje utilizado para especificar cómo modificar. los fragmentos de archivos (bloqueo de transacciones y concurrencia) El bloqueo de transacciones admitido generalmente es para todo el documento, por lo que la concurrencia multiusuario es relativamente baja El tamaño del problema depende de la aplicación Y la composición del archivo () La base de datos nativa proporciona programación de aplicaciones interfaces API (API de interfaces de programación de aplicaciones) () Una característica importante de NXD es que puede proporcionar un viaje de ida y vuelta para que los archivos XML se puedan almacenar en NXD y recuperar el mismo archivo es muy importante para aplicaciones centradas en documentos. debido a que los comentarios de uso de la entidad de la sección CDATA y las instrucciones de procesamiento son una parte integral de estos documentos, especialmente para documentos legales y médicos, estos documentos deben permanecer intactos ( ) Datos externos (datos remotos) Algunos NXD pueden contener datos externos, que provienen de documentos almacenados en. la base de datos. Por lo general, estos datos se recuperan de datos relacionales a través de OD BC, OLE DB o JDBC. El modelo puede estar basado en tablas o en un mapeo relacional de objetos ( ). /p>
La aparición de la tecnología XML ha provocado un ciclo de procesamiento de datos desde el modo de archivo al sistema de base de datos y luego al modo de archivo. Sin embargo, el nuevo modo de archivo ya se ha comparado con el sistema original. El documento formateado XML y la base de datos relacional tienen sus propias ventajas en la aplicación y gestión de datos lishixinzhi/Article/program/net/201311/12776
.