Red de conocimiento informático - Aprendizaje de código fuente - ¿Para qué se utiliza un software como una base de datos?

¿Para qué se utiliza un software como una base de datos?

La siguiente información se encontró en Baidu. Puedes consultarla cuando tengas tiempo.

Trabajo en TI. Déjame decirte mis sentimientos. Es sólo para referencia.

Las bases de datos se utilizan para la comodidad del almacenamiento y operación de los datos. Está bien si no lo necesita. A veces, está bien registrar los datos en un archivo (como txt), pero es más problemático operar con una gran cantidad de datos.

Hoy en día existen muchos tipos de bases de datos, tanto grandes como pequeñas, por lo que es bastante conveniente que se puedan utilizar.

Definición 1

Existen diferentes definiciones (descriptivas por supuesto) cuando las personas describen este concepto desde diferentes perspectivas. Por ejemplo, se dice que una base de datos es un "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Otro ejemplo es que una base de datos es "una colección de datos relacionados que las personas almacenan juntos de una determinada forma organizativa para resolver tareas específicas" (esta definición se centra en la organización de datos). Algunos incluso llaman a la base de datos "un almacén de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.

Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según una estructura de datos". En el trabajo diario de la gestión económica, a menudo es necesario colocar ciertos datos relevantes en dicho "almacén" y procesarlos en consecuencia de acuerdo con las necesidades de la gestión. Por ejemplo, el departamento de personal de una empresa o institución pública a menudo almacena la información básica de sus empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.) en una tabla. como base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados cuyos salarios están dentro de un cierto rango, etc. Si todas estas tareas se pueden realizar automáticamente en ordenadores, entonces nuestra gestión de personal podrá alcanzar un nivel extremadamente alto. Además, también es necesario establecer muchas "bases de datos" de este tipo en la gestión financiera, la gestión de almacenes y la gestión de producción, de modo que las computadoras puedan utilizarse para realizar la gestión automatizada de las finanzas, el almacén y la producción.

J.Martin dio una definición relativamente completa de una base de datos: una base de datos es una colección de datos relacionados almacenados juntos que está estructurada, no tiene redundancia dañina o innecesaria y proporciona una variedad de servicios de almacenamiento de datos; es independiente del programa que lo utiliza; se pueden insertar nuevos datos en la base de datos y los datos originales se pueden modificar y recuperar de forma común y controlable. Cuando en un sistema hay varias bases de datos estructuralmente completamente separadas, el sistema contiene una "colección de bases de datos".

Definición 2

Una base de datos es una colección de datos organizados según un determinado modelo de datos y almacenados en un almacenamiento secundario. Este tipo de recopilación de datos tiene las siguientes características: es lo menos duplicada posible, sirve de manera óptima a múltiples aplicaciones de una organización específica, su estructura de datos es independiente de las aplicaciones que la utilizan, y la adición, eliminación, modificación y la recuperación de datos se realizan mediante software unificado para gestión y control. Desde la perspectiva de la historia del desarrollo, la base de datos es una etapa avanzada de la gestión de datos, que se desarrolló a partir del sistema de gestión de archivos.

[Editar este párrafo] La estructura básica de la base de datos

La estructura básica de la base de datos se divide en tres niveles, lo que refleja tres perspectivas diferentes de observación de la base de datos.

(1) Capa de datos físicos.

Es la capa más interna de la base de datos y es una colección de datos realmente almacenados en el dispositivo de almacenamiento físico. Estos datos son datos sin procesar, que son objetos procesados ​​por el usuario. Están compuestos por cadenas de bits, caracteres y palabras procesadas por las operaciones de instrucción descritas por el modo interno.

(2) Capa de datos conceptuales.

Es la capa intermedia de la base de datos y la representación lógica general de la base de datos. Señala la definición lógica de cada dato y la conexión lógica entre los datos, y es una colección de registros de almacenamiento. Implica la relación lógica de todos los objetos de la base de datos, más que su situación física. Es una base de datos bajo el concepto de administrador de base de datos.

(3) Capa de datos lógica.

Es una base de datos que los usuarios ven y usan, y representa una colección de datos utilizados por uno o algunos usuarios específicos, es decir, una colección de registros lógicos.

Las conexiones entre los diferentes niveles de la base de datos se transforman mediante mapeo.

[Editar este párrafo] Características principales de la base de datos

(1) Realizar el intercambio de datos.

El intercambio de datos incluye que todos los usuarios puedan acceder a los datos de la base de datos al mismo tiempo. También incluye que los usuarios puedan usar la base de datos de varias maneras a través de la interfaz y proporciona el intercambio de datos.

(2) Reducir la redundancia de datos.

En comparación con el sistema de archivos, debido a que la base de datos permite compartir datos, evita que los usuarios creen archivos de aplicación individualmente. Reduce una gran cantidad de datos duplicados, reduce la redundancia de datos y mantiene la coherencia de los datos.

(3) Independencia de los datos.

La independencia de datos incluye que la estructura lógica de la base de datos en la base de datos es independiente del programa de aplicación, y también incluye que los cambios en la estructura física de los datos no afectan la estructura lógica de los datos. .

(4) Control centralizado de datos.

En el método de administración de archivos, los datos están dispersos y no existe relación entre los archivos de diferentes usuarios o el mismo usuario en diferentes procesos. Las bases de datos se pueden utilizar para controlar y gestionar datos de forma centralizada y representar la organización de diversos datos y las relaciones entre datos a través de modelos de datos.

(5) Coherencia y mantenibilidad de los datos para garantizar la seguridad y confiabilidad de los datos.

Incluye principalmente: ① Control de seguridad: para evitar la pérdida de datos, actualizaciones incorrectas y uso no autorizado; ② Control de integridad: para garantizar la exactitud, validez y compatibilidad de los datos; ③ Control de concurrencia: para habilitar al mismo tiempo; período, permite accesos múltiples a los datos y evita interacciones anormales entre los usuarios ④ Descubrimiento y recuperación de fallas: el sistema de administración de bases de datos proporciona un conjunto de métodos para detectar y reparar fallas de manera oportuna, evitando así la destrucción de datos.

[Editar este párrafo] Etapa de desarrollo de la base de datos

La etapa de desarrollo de la base de datos se divide aproximadamente en las siguientes etapas:

Etapa de gestión manual;

Sistema de archivos etapa;

Etapa del sistema de base de datos;

Etapa de base de datos avanzada.

[Editar este párrafo] Estructura de la base de datos y tipos de base de datos

Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos en red y bases de datos relacionales. Diferentes bases de datos están relacionadas y organizadas según diferentes estructuras de datos.

1. Modelo de estructura de datos

(1) Estructura de datos

La llamada estructura de datos se refiere a la forma organizativa de los datos o la relación entre los datos. Si D se usa para representar datos y R se usa para representar el conjunto de relaciones que existen entre objetos de datos, entonces DS = (D, R) se denomina estructura de datos. Por ejemplo, existe un directorio telefónico que registra los nombres y números de teléfono correspondientes de n personas. Para encontrar fácilmente el número de teléfono de alguien, organice el nombre y el número de la persona en el orden del diccionario, con el nombre seguido del número de teléfono correspondiente. De esta forma, si quieres encontrar el número de teléfono de alguien (suponiendo que la primera letra de su nombre sea Y), sólo necesitarás buscar aquellos nombres que empiecen por Y. En este ejemplo, el conjunto de datos D es el nombre y el número de teléfono de la persona, y la relación R entre ellos está ordenada en el orden del diccionario. La estructura de datos correspondiente es DS = (D, R), que es una matriz. (2) Tipos de estructuras de datos

Las estructuras de datos se dividen en estructuras lógicas de datos y estructuras físicas de datos. La estructura lógica de los datos consiste en observar y analizar datos desde una perspectiva lógica (es decir, la conexión y organización de los datos), independientemente de la ubicación de almacenamiento de los datos. La estructura física de los datos se refiere a la estructura en la que se almacenan los datos en la computadora, es decir, la forma de implementación de la estructura lógica de los datos en la computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Aquí solo estudiamos la estructura lógica de los datos, y el método para reflejar y realizar conexiones de datos se denomina modelo de datos.

Actualmente, existen tres modelos de datos populares, a saber, el modelo de estructura jerárquica y el modelo de estructura de red basado en la teoría de grafos, y el modelo de estructura relacional basado en la teoría de relaciones.

2. Sistemas de bases de datos jerárquicas, en red y relacionales

(1) Modelo de estructura jerárquica

El modelo de estructura jerárquica es esencialmente un nodo raíz Árbol ordenado dirigido (en matemáticas, un "árbol" se define como un gráfico conectado sin retorno). Por ejemplo, la Figura 20.6.4 es el organigrama de una institución de educación superior. Esta estructura organizativa es como un árbol. La escuela es la raíz del árbol (llamada nodo raíz). Los departamentos, carreras, profesores, estudiantes, etc. son las ramas (llamadas nodos). llamado nodo raíz es un borde, y la relación entre las raíces del árbol y los bordes es 1: N, es decir, solo hay una raíz y N ramas.

Un sistema de base de datos establecido según un modelo jerárquico se denomina sistema de base de datos de modelo jerárquico. IMS (Sistema de Gestión de la Información) es su representante típico.

(2) Modelo de estructura de red

Un sistema de base de datos establecido de acuerdo con una estructura de datos de red se denomina sistema de base de datos de red y su representante típico es DBTG (Grupo de tareas de base de datos). La estructura de datos de la red se puede convertir en una estructura de datos jerárquica utilizando métodos matemáticos.

(3) Modelo de estructura relacional

La estructura de datos relacional reduce algunas estructuras de datos complejas a relaciones binarias simples (es decir, forma de tabla bidimensional). Por ejemplo, la relación de los empleados en una determinada unidad es una relación binaria.

Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.

En una base de datos relacional, casi todas las operaciones sobre datos se basan en una o más tablas relacionales. La gestión de datos se logra mediante operaciones como clasificación, fusión, conexión o selección de estas tablas relacionales. dBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como un problema de gestión de personal), a veces se necesitan múltiples relaciones para lograrlo. Una relación establecida con dBASEII se denomina base de datos (o archivo de base de datos), y varias bases de datos establecidas correspondientes a múltiples relaciones se denominan sistemas de bases de datos. Otra función importante de dBASEII es realizar el uso y gestión de la base de datos mediante el establecimiento de archivos de comando. El archivo de secuencia de comandos correspondiente para un sistema de base de datos se denomina sistema de aplicación de la base de datos. Por tanto, se puede resumir que una relación se denomina base de datos y varias bases de datos pueden constituir un sistema de base de datos. El sistema de base de datos puede derivar varios tipos de archivos auxiliares y sistemas de aplicaciones que lo construyen.

[Editar este párrafo] Bases de datos de uso común

1. DB2 de IBM

Como pionero y líder en el campo de las bases de datos relacionales, IBM completó el El prototipo El sistema System R comenzó a proporcionar un servidor de base de datos integrado: System/38 en 1980, seguido de SQL/DS para VSE y VM. Su versión inicial está estrechamente relacionada con el prototipo de investigación SystemR. DB2 para MVSV1 se lanzó en 1983. El objetivo de esta versión es ofrecer la simplicidad, la irrelevancia de los datos y la productividad del usuario prometida por este nuevo esquema. En 1988, DB2 para MVS proporcionó un potente soporte de procesamiento de transacciones en línea (OLTP). En 1989 y 1993, implementó soporte de bases de datos distribuidas con unidades de trabajo remotas y unidades de trabajo distribuidas, respectivamente. DB2 Universal Database 6.1, lanzado recientemente, es un modelo de base de datos universal. Es el primer sistema de gestión de bases de datos relacionales multimedia con funciones en línea y admite una serie de plataformas, incluido Linux.

2. Oracle

Oracle, anteriormente conocido como SDL, fue fundado en 1977 por Larry Ellison y otros dos programadores. Desarrollaron su propio producto estrella y lo vendieron en grandes cantidades en Internet. mercado En 1979 En 2006, Oracle introdujo el primer sistema comercial de gestión de bases de datos relacionales SQL. Oracle es uno de los primeros proveedores en desarrollar bases de datos relacionales y sus productos admiten la más amplia gama de plataformas de sistemas operativos. Actualmente, los productos de bases de datos relacionales de Oracle tienen la mayor cuota de mercado.

3. Informix

Informix se fundó en 1980 para proporcionar productos profesionales de bases de datos relacionales para sistemas operativos abiertos como Unix. El nombre de la empresa, Informix, deriva de la combinación de Information y Unix. El primer producto de base de datos relacional de Informix que realmente soporta el lenguaje SQL es Informix SE (StandardEngine). InformixSE era el principal producto de base de datos en el entorno de microcomputadoras Unix en ese momento. También fue el primer producto de base de datos comercial que se portó a Linux.

4. Sybase

Sybase se fundó en 1984. El nombre de la empresa "Sybase" proviene de la combinación de "sistema" y "base de datos". Bob Epstein, uno de los fundadores de Sybase, es el diseñador principal de Ingres University Edition (un producto modelo de base de datos relacional al mismo tiempo que System/R). El primer producto de base de datos relacional de la empresa fue Sybase SQLServer1.0, lanzado en mayo de 1987. Sybase propuso por primera vez la idea de una arquitectura de base de datos Cliente/Servidor y fue el primero en implementarla en Sybase SQLServer.

5. SQL Server

En 1987, Microsoft e IBM cooperaron para desarrollar OS/2. IBM incluyó OS/2Database Manager en el sistema OS/2 ExtendedEdition que todavía existe. Falta de productos de bases de datos en la línea de productos de Microsoft. Con este fin, Microsoft puso su mirada en Sybase y firmó un acuerdo de cooperación con Sybase para utilizar la tecnología de Sybase para desarrollar una base de datos relacional basada en la plataforma OS/2. En 1989, Microsoft lanzó la versión 1.0 de SQL Server.

6. PostgreSQL

PostgreSQL es un objeto de software gratuito con funciones muy completas: un sistema de gestión de bases de datos relacionales (ORDBMS). Muchas de sus funciones son comunes a muchas bases de datos comerciales actuales. . PostgreSQL comenzó como el proyecto Ingres de BSD. Las características de PostgreSQL cubren SQL-2/SQL-92 y SQL-3. En primer lugar, incluye soporte para lo que se puede decir que son los tipos de datos más ricos del mundo; en segundo lugar, PostgreSQL es actualmente el único software gratuito que admite transacciones, subconsultas, sistemas de control paralelo de múltiples versiones, comprobaciones de integridad de datos y otras características. sistema de gestión de bases de datos.

7.mySQL

mySQL es un pequeño sistema de gestión de bases de datos relacionales desarrollado por la empresa sueca MySQL AB. Fue adquirida por Sun el 16 de enero de 2008. Actualmente, MySQL se utiliza ampliamente en sitios web pequeños y medianos en Internet. Debido a su pequeño tamaño, alta velocidad, bajo costo total de propiedad y especialmente a las características del código abierto, muchos sitios web pequeños y medianos eligen MySQL como su base de datos para reducir el costo total de propiedad del sitio web.

La URL del sitio web oficial de MySQL es: www.mysql.com

[Editar este párrafo] Historia del desarrollo de bases de datos

La tecnología de bases de datos ha transcurrido desde su nacimiento hasta el presente en menos de un siglo. Durante más de medio siglo se han formado aquí una base teórica sólida, productos comerciales maduros y una amplia gama de campos de aplicación, lo que atrae cada vez a más investigadores. El nacimiento y desarrollo de las bases de datos ha supuesto una gran revolución en la gestión de la información informática. Durante los últimos treinta años, se han desarrollado y construido miles de bases de datos en el país y en el extranjero, y se han convertido en la infraestructura para el trabajo, la producción y la vida diaria de empresas, departamentos e incluso individuos. Al mismo tiempo, con la expansión y profundización de las aplicaciones, el número y la escala de las bases de datos están aumentando, y el campo de investigación de las bases de datos también se ha ampliado y profundizado enormemente. En los últimos 30 años, el campo de las bases de datos ha obtenido la computadora Turing tres veces (C.W. Bachman, E.F. Codd, J. Gray), lo que demuestra más plenamente que las bases de datos son un campo lleno de vitalidad y espíritu innovador. Sigamos la trayectoria histórica y rastreemos el desarrollo de la base de datos.

1. Una breve historia del desarrollo de las bases de datos

1. El nacimiento de la gestión de datos

La historia de las bases de datos se remonta a hace cincuenta años, cuando los datos La gestión fue muy sencilla. Los datos se procesaron mediante máquinas masivas de clasificación, comparación y tabulación que procesaban millones de tarjetas perforadas, y los resultados se imprimieron en papel o se convirtieron en nuevas tarjetas perforadas. La gestión de datos es el almacenamiento físico y el procesamiento de todas estas tarjetas perforadas. Sin embargo, en 1951 una computadora llamada Univac I de Remington Rand Inc. lanzó una unidad de cinta que podía ingresar cientos de registros por segundo, lo que provocó una revolución en la gestión de datos. En 1956, IBM produjo la primera unidad de disco: el modelo 305 RAMAC. Esta unidad tiene 50 platos, cada plato tiene 2 pies de diámetro y puede almacenar 5 MB de datos. La mayor ventaja de utilizar discos es que se puede acceder a los datos de forma aleatoria, mientras que las tarjetas perforadas y las cintas sólo pueden acceder a los datos de forma secuencial.

1951: El sistema Univac utiliza cinta magnética y tarjetas perforadas para el almacenamiento de datos.

Las semillas de los sistemas de bases de datos aparecieron en la década de 1960. En ese momento, las computadoras comenzaron a usarse ampliamente en la gestión de datos, lo que planteaba requisitos cada vez más altos para el intercambio de datos. Los sistemas de archivos tradicionales ya no pueden satisfacer las necesidades de las personas. Los sistemas de gestión de bases de datos (DBMS) que pueden gestionar y compartir datos de manera uniforme surgieron a medida que los tiempos lo exigían. El modelo de datos es el núcleo y la base del sistema de base de datos, y varios software DBMS se basan en un determinado modelo de datos. Por tanto, los sistemas de bases de datos tradicionales suelen dividirse en tres categorías: base de datos de red, base de datos jerárquica y base de datos relacional según las características del modelo de datos.

El primer DBMS de malla apareció, que fue el IDS (Integrated DataStore) desarrollado con éxito por Bachman y otros de General Electric Company en los Estados Unidos en 1961. En 1961, Charles Bachman de General Electric Co. desarrolló con éxito el primer DBMS de malla del mundo y el primer sistema de gestión de bases de datos: Integrated DataStore IDS, sentando las bases para las bases de datos de malla y se distribuyó y aplicó ampliamente en ese momento. IDS tiene características de esquema de datos y registros. Pero solo se puede ejecutar en el host GE, la base de datos tiene un solo archivo y todas las tablas de la base de datos deben generarse mediante codificación manual. Más tarde, un cliente de GE, BF Goodrich Chemical, acabó teniendo que reescribir todo el sistema. Y el sistema reescrito se denominó Sistema Integrado de Gestión de Datos (IDMS).

El modelo de base de datos de red puede simular naturalmente cosas jerárquicas y no jerárquicas. Antes de la aparición de las bases de datos relacionales, los DBMS de red se usaban más comúnmente que los DBMS jerárquicos.

En la historia del desarrollo de bases de datos, las bases de datos en red ocupan una posición importante.

El DBMS jerárquico aparece siguiendo de cerca la base de datos de la red. El sistema de base de datos jerárquico más famoso y típico es el IMS (Sistema de gestión de información) desarrollado por IBM en 1968, una base de datos jerárquica adecuada para su host. Este es el primer producto de programa de sistema de base de datos a gran escala desarrollado por IBM. Desde su aparición a fines de la década de 1960, ahora se ha desarrollado para IMSV6, brindando soporte para funciones avanzadas como agrupación en clústeres, intercambio de datos de canal N y uso compartido de colas de mensajes. Este producto de base de datos de 30 años desempeña un nuevo papel en las conexiones de aplicaciones WWW y aplicaciones de inteligencia empresarial de hoy.

En 1973, Cullinane Company (más tarde Cullinet Software Company) comenzó a vender una versión mejorada del IDMS de Goodrich Company y poco a poco se convirtió en la empresa de software más grande del mundo en ese momento.

2. El origen de las bases de datos relacionales

Las bases de datos en red y las bases de datos jerárquicas han resuelto bien los problemas de concentración e intercambio de datos, pero a nivel de independencia y abstracción de datos todavía hay un mucho que desear. Cuando los usuarios acceden a estas dos bases de datos, aún deben aclarar la estructura de almacenamiento de los datos e indicar la ruta de acceso. La base de datos relacional que surgió más tarde resolvió mejor estos problemas.

En 1970, el investigador de IBM Dr. E.F. Codd publicó un artículo titulado "A Relational Model of Data for Large Shared Data Banks" en la revista "Communication of the ACM", proponiendo el modelo relacional. El concepto sienta las bases Fundamentos teóricos del modelo relacional. Aunque Childs había propuesto previamente un modelo orientado a conjuntos en 1968, este artículo generalmente se considera un hito que hace época en la historia de los sistemas de bases de datos. El deseo de Codd es construir un hermoso modelo de datos para la base de datos. Más tarde, Codd publicó muchos artículos uno tras otro, discutiendo la teoría del paradigma y 12 criterios para medir sistemas relacionales, utilizando la teoría matemática para sentar las bases de las bases de datos relacionales. El modelo relacional tiene una base matemática estricta, un nivel relativamente alto de abstracción y es simple y claro, lo que lo hace fácil de entender y usar. Sin embargo, en ese momento, algunas personas creían que el modelo relacional era un modelo de datos ideal y que no era realista implementar un DBMS. Estaban particularmente preocupados de que el rendimiento de la base de datos relacional fuera inaceptable. amenaza para el trabajo de estandarización de bases de datos de red en curso en ese momento. Para promover la comprensión del problema, ACM tomó la iniciativa de organizar un simposio en 1974, en el que tuvo lugar un debate entre partidarios y opositores de las bases de datos relacionales, encabezados por Codd y Bachman respectivamente. Este famoso debate impulsó el desarrollo de bases de datos relacionales, que eventualmente se convirtieron en la corriente principal de los productos de bases de datos modernos.

1969: Édgar F. "Ted" Codd inventó la base de datos relacional

Después del establecimiento del modelo relacional en 1970, IBM incorporó más investigadores al Laboratorio de San José para estudiar este proyecto, que es el famoso Sistema R. Su objetivo es demostrar la viabilidad de un DBMS relacional con todas las funciones. El proyecto finalizó en 1979 con la primera implementación DBMS de SQL. Sin embargo, el compromiso de IBM con IMS impidió que System R se pusiera en producción, y no fue hasta 1980 que System R se lanzó oficialmente al mercado como producto. Hay tres razones para el lento ritmo de producción de IBM: IBM concede gran importancia a la reputación, la calidad y la minimización de fallas; IBM es una gran empresa con una enorme burocracia; IBM ya tiene productos de bases de datos jerárquicos y el personal relevante no está activo o no; incluso opuesto.

Sin embargo, al mismo tiempo, en 1973, Michael Stonebraker y Eugene Wong de la Universidad de California, Berkeley, comenzaron a desarrollar su propio sistema de base de datos relacional, Ingres, utilizando la información liberada por System R. El proyecto Ingres que desarrollaron fue finalmente comercializado por Oracle, Ingres y otros proveedores en Silicon Valley. Más tarde, tanto el sistema System R como el Ingres ganaron el "Premio al sistema de software" de la ACM en 1988.

En 1976, Honeywell desarrolló el primer sistema de base de datos relacional comercial: Multics Relational Data Store. El sistema de base de datos relacional se basa en el álgebra relacional como base teórica sólida. Después de décadas de desarrollo y aplicación práctica, la tecnología se ha vuelto cada vez más madura y perfecta. Sus productos representativos incluyen Oracle, DB2 de IBM, MS SQL Server de Microsoft, Informix, ADABASD, etc.

3. Lenguaje de consulta estructurado (SQL)

En 1974, Ray Boyce y Don Chamberlin de IBM expresaron la definición matemática de los 12 principios de la base de datos relacional de Codd en una sintaxis de palabras clave simple. demostró que el lenguaje SQL (lenguaje de consulta estructurado) se propuso como un hito. Las funciones del lenguaje SQL incluyen consulta, manipulación, definición y control. Es un lenguaje de base de datos relacional integral y universal. También es un lenguaje no procedimental que solo requiere que los usuarios indiquen qué hacer, pero no cómo hacerlo. . La integración SQL implementa todas las operaciones en el ciclo de vida de la base de datos. SQL proporciona métodos para interactuar con bases de datos relacionales y puede funcionar con lenguajes de programación estándar. Desde sus inicios, el lenguaje SQL se ha convertido en la piedra de toque para probar bases de datos relacionales, y cada cambio en el estándar del lenguaje SQL guía la dirección de desarrollo de los productos de bases de datos relacionales. Sin embargo, no fue hasta mediados de la década de 1970 que la teoría relacional se utilizó en las bases de datos comerciales Oracle y DB2 vía SQL.

En 1986, ANSI adoptó SQL como estándar americano para lenguajes de bases de datos relacionales y publicó el texto SQL estándar ese mismo año. Actualmente existen tres versiones del estándar SQL. La definición básica de SQL es ANSIX3135-89, "Lenguaje de base de datos - SQL con mejora de integridad" [ANS89], generalmente llamado SQL-89. SQL-89 define la definición de esquemas, las operaciones de datos y el procesamiento de transacciones.

SQL-89 y posteriores ANSIX3168-1989, "SQL incorporado en lenguaje de base de datos" constituyen la primera generación de estándares SQL. ANSIX3135-1992 [ANS92] describe una versión mejorada de SQL, ahora denominada estándar SQL-92. SQL-92 incluye operaciones de esquema, creación dinámica y ejecución dinámica de declaraciones SQL, soporte de entorno de red y otras características mejoradas. Después de completar el estándar SQL-92, ANSI e ISO comenzaron a cooperar para desarrollar el estándar SQL3. La característica principal de SQL3 es el soporte de tipos de datos abstractos, lo que proporciona un estándar para una nueva generación de bases de datos relacionales de objetos.

1969: Edgar F. Codd inventó la base de datos relacional

En 1976, IBM E.F. Codd publicó un artículo histórico "R System: Database Relational Theory", que introdujo la teoría de la base de datos relacional y lenguaje de consulta SQL. Ellison, el fundador de Oracle, leyó este artículo con mucha atención y quedó impactado por su contenido. Esta era la primera vez que alguien utilizaba una solución integral y consistente para administrar la información de datos.

El autor E.F. Codd publicó la teoría de la base de datos relacional hace diez años y desarrolló un prototipo en el IBM Research Institute. Este proyecto es el sistema R y el lenguaje para acceder a las tablas de datos es SQL. Después de leerlo, Ellison se dio cuenta de que se podían desarrollar sistemas de software comerciales basándose en esta investigación. En ese momento, la mayoría de la gente creía que las bases de datos relacionales no tendrían valor comercial. Ellison vio esto como su oportunidad: decidieron desarrollar un sistema de base de datos comercial de propósito general, Oracle, llamado así por un proyecto en el que habían trabajado para la CIA. Unos meses más tarde, desarrollaron Oracle 1.0. Pero era sólo un juguete. No podía hacer nada excepto completar consultas relacionales simples. Les tomó mucho tiempo hacer que Oracle estuviera disponible para mantener la empresa en funcionamiento, dependía principalmente de realizar algunos proyectos de gestión de bases de datos y realizar trabajos de consultoría. Pero IBM no tiene planes de desarrollarlo. Hay muchas razones por las que Big Blue renunció a este producto valorado en decenas de miles de millones: la mayoría de los investigadores de IBM tienen formación académica y lo que más les interesa es la teoría, no los productos que se lanzarán al mercado. Desde un punto de vista académico, los resultados de la investigación deben hacerse públicos. Publicar artículos y dar conferencias puede hacerlos famosos, así que ¿por qué no? Otra razón importante es que IBM tenía un producto de base de datos jerárquico IMS que se vendía bien en ese momento. No fue hasta 1985 que IBM lanzó la base de datos relacional DB2, momento en el que Ellision se había convertido en multimillonario. Ellison comparó una vez la elección por parte de IBM del MS-DOS de Microsoft como sistema operativo del IBM-PC con: "El error más grave en la historia de las operaciones comerciales mundiales, valorado en más de cientos de miles de millones de dólares, los artículos sobre el sistema R publicados por IBM". y no hubo mucho. El error de lanzar rápidamente un producto de base de datos relacional es probablemente el segundo error más común. La capitalización de mercado de Oracle alcanzó los 28 mil millones de dólares en 1996.

Actualmente existen 3 versiones del estándar SQL. La definición básica de SQL es ANSIX3135-89, "Lenguaje de base de datos - SQL con IntegrityEnhancement" [ANS89], generalmente llamado SQL-89. SQL-89 define la definición de esquemas, la manipulación de datos y el procesamiento de transacciones. SQL-89 y el posterior ANSIX3168-1989, "Lenguaje de base de datos: SQL incorporado" constituyeron la primera generación de estándares SQL. ANSIX3135-1992 [ANS92] describe una versión mejorada de SQL, ahora denominada estándar SQL-92. SQL-92 incluye operaciones de esquema, creación dinámica y ejecución dinámica de declaraciones SQL, soporte de entorno de red y otras características mejoradas. Después de completar el estándar SQL-92, ANSI e ISO comenzaron a cooperar para desarrollar el estándar SQL3. La característica principal de SQL3 es el soporte de tipos de datos abstractos, lo que proporciona un estándar para una nueva generación de bases de datos relacionales de objetos.

4. Base de datos orientada a objetos

Con el desarrollo de la tecnología de la información y el mercado, la gente ha descubierto que aunque la tecnología del sistema de base de datos relacional es muy madura, sus limitaciones también son obvias: puede manejar bien los llamados "datos tabulares", pero no puede manejar tipos de datos cada vez más complejos que aparecen en el mundo de la tecnología. Desde la década de 1990, la comunidad técnica ha estado investigando y buscando nuevos sistemas de bases de datos. Sin embargo, la industria alguna vez estuvo bastante confundida en cuanto a cuál es la dirección de desarrollo de los nuevos sistemas de bases de datos. Afectados por la tendencia tecnológica en ese momento, durante un período de tiempo considerable, la gente gastó mucha energía en estudiar el "sistema de base de datos orientado a objetos (base de datos orientada a objetos)" o el "sistema de base de datos OO" para abreviar. Vale la pena mencionar que la teoría de la base de datos relacional orientada a objetos propuesta por el profesor estadounidense Stonebraker alguna vez fue favorecida por la industria. El propio Stonebraker fue contratado como jefe técnico por Informix a un alto costo en ese momento.

Sin embargo, varios años de desarrollo han demostrado que el desarrollo del mercado de productos de sistemas de bases de datos relacionales orientados a objetos no es ideal.

La perfección teórica no generó una respuesta entusiasta del mercado. La razón principal de su fracaso es que la idea principal de diseño de este producto de base de datos es intentar reemplazar el sistema de base de datos existente con un nuevo sistema de base de datos. Para muchos clientes, especialmente los grandes, que han utilizado sistemas de bases de datos durante muchos años y han acumulado una gran cantidad de datos de trabajo, no pueden permitirse la enorme carga de trabajo y los enormes gastos causados ​​por la conversión entre datos antiguos y nuevos. Además, los sistemas de bases de datos relacionales orientados a objetos hacen que los lenguajes de consulta sean extremadamente complejos, lo que hace que las tecnologías de aplicaciones complejas sean una perspectiva desalentadora tanto para los desarrolladores de bases de datos como para los clientes de aplicaciones.

5. Cambios en la gestión de datos

A finales de los años 60, apareció un nuevo tipo de software de base de datos: el sistema de soporte a la decisión (DSS), cuyo propósito era permitir a los directivos tomar decisiones. uso más efectivo de la información de los datos en el proceso. Así, en 1970 nació Express, la primera herramienta de procesamiento analítico en línea. Siguieron otros sistemas de apoyo a la toma de decisiones, muchos de ellos desarrollados por departamentos de TI corporativos.

En 1985, Metaphor Computer Systems Co., Ltd. desarrolló el primer sistema de inteligencia empresarial (inteligencia empresarial) para Procter & Gamble Company. Se utilizó principalmente para conectar información de ventas y datos de escáneres minoristas. Ese mismo año, Pilot Software comenzó a vender Command Center, el primer sistema comercial de información de ejecución cliente/servidor. También ese año, el proyecto Ingres de UC Berkeley evolucionó a Postgres, con el objetivo de desarrollar una base de datos orientada a objetos. Un año después, Graphhael desarrolló el primer sistema de base de datos de objetos comerciales: Gbase.

En 1988, los investigadores de IBM Barry Devlin y Paul Murphy inventaron un nuevo término: almacén de información. Después de eso, los proveedores de TI comenzaron a construir almacenes de datos experimentales. En 1991, W.H. "Bill" Inmon publicó un libro "Cómo construir un almacén de datos", que realmente inició la aplicación de los almacenes de datos.

1991: W.H. "Bill" Inmon publica "Building Data Warehouses"

La década de 1990, con la llegada de los modelos informáticos cliente/servidor basados ​​en PC y los paquetes de software empresarial. La transformación de la gestión de datos está casi completa. La gestión de datos ya no se trata solo de almacenar y gestionar datos, sino que se ha transformado en varios métodos de gestión de datos que los usuarios necesitan. El repentino auge de Internet y la aparición del lenguaje XML han abierto un nuevo mundo para el desarrollo de sistemas de bases de datos.

[Editar este párrafo] Tendencias futuras de desarrollo de las bases de datos

Con la continua expansión del contenido de gestión de la información, ha surgido un modelo de datos rico y diverso (modelo jerárquico, modelo de red, modelo relacional , Modelo orientado a objetos, modelo semiestructurado, etc.), y nuevas tecnologías están surgiendo sin cesar (flujo de datos, gestión de datos web, minería de datos, etc.). Actualmente, cada pocos años, algunos expertos de alto nivel en bases de datos del mundo se reúnen para discutir el estado actual de la investigación de bases de datos, los problemas existentes y el enfoque de las nuevas tecnologías que requieren atención en el futuro. Varios informes similares en el pasado incluyen: 1989 Direcciones futuras en la investigación de DBMS: los participantes de Laguna Beach, 1990 Sistemas de bases de datos: logros y oportunidades, 1995 Base de datos 1991: W.H Inmon publicó "Building Data Warehouses"