¿Cuál es el objetivo de una base de datos?
Definición 1
Cuando las personas describen este concepto desde diferentes perspectivas, existen diferentes definiciones (descriptivas por supuesto). Por ejemplo, una base de datos se denomina "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Otro ejemplo es decir que una base de datos es "una colección de datos relacionados que las personas almacenan juntos de alguna manera organizada para resolver una tarea específica" (esta definición se centra en la organización de los datos). Algunas personas incluso dicen que la base de datos es un "almacén de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.
Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según una estructura de datos". En el trabajo diario de gestión económica, a menudo es necesario colocar algunos datos relevantes en dicho "almacén" y procesarlos en consecuencia de acuerdo con las necesidades de gestión. Por ejemplo, el departamento de personal de una empresa o institución a menudo almacena la información básica de sus empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.) en una tabla. una base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados dentro de un determinado rango salarial, etc. Si todas estas tareas se pueden realizar automáticamente en el ordenador, entonces nuestra gestión de personal podrá alcanzar un nivel muy alto. Además, también es necesario establecer una gran cantidad de estas "bases de datos" en la gestión financiera, la gestión de almacenes y la gestión de producción, de modo que las computadoras puedan utilizarse para realizar la gestión automatizada de las finanzas, el almacén y la producción.
J. Martin dio una definición relativamente completa de una base de datos: una base de datos es una colección de datos relacionados que está estructurada, no tiene redundancia dañina o innecesaria y puede usarse para una variedad de propósitos; los datos se almacenan independientemente del programa que los utiliza; insertar nuevos datos en la base de datos, modificar y recuperar datos originales se puede realizar de forma común y controlable. La base de datos se puede utilizar de forma versátil y controlada. Cuando varias bases de datos están estructuralmente separadas entre sí, el sistema contiene una "colección de bases de datos".
Definición 2
Una base de datos es una colección de datos organizados según un modelo de datos y almacenados en un almacenamiento secundario. Este tipo de recopilación de datos tiene las siguientes características: es lo menos duplicada posible, se utiliza de la mejor manera para múltiples aplicaciones de una organización específica, su estructura de datos es independiente de la aplicación que los utiliza y la adición, eliminación , modificación y recuperación de datos se realizan mediante un sistema unificado de gestión y control del Software. Desde la perspectiva de la historia del desarrollo, la base de datos es una etapa avanzada de la gestión de datos, que se desarrolló a partir del sistema de gestión de documentos.
Definición 3 (Opinión del Comité de Expertos sobre el Protocolo del Convenio de Berna)
Todas las compilaciones de información (datos, hechos, etc.), ya sea en forma impresa, informática unidades de almacenamiento, u otra forma, se consideran "bases de datos".
Existen muchas razones para elegir contenidos digitales, que se pueden resumir en las siguientes:
(1) Razones del espacio de almacenamiento. Un gran número de usuarios acceden a los productos digitales y los utilizan a través de la red, y todos sabemos que los productos digitales se almacenan en matrices de discos. Las matrices de discos son administradas por servidores. El espacio en disco es limitado y la capacidad del servidor. También es limitado. El almacenamiento ilimitado de recursos digitales nos obliga a seleccionar recursos literarios para el contenido digital.
(2) La necesidad de resolver la contradicción entre el alto coste de la producción digital y los limitados fondos bibliotecarios. Pocas bibliotecas tienen recursos suficientes para digitalizar todas sus colecciones y la selección de contenidos es inevitable.
(3) La necesidad de la gestión de recursos digitales. El rápido desarrollo de la tecnología ha hecho que el ciclo de vida de los recursos digitales generados por proyectos digitales sea cada vez más corto. Invertir enormes cantidades de dinero en la migración digital es una forma importante de extender la vida útil de los recursos digitales. Se deben considerar los costosos costos de mantenimiento del contenido digital. selección.
Historia del desarrollo de bases de datos Desde su nacimiento hasta el presente, en menos de medio siglo, la tecnología de bases de datos ha formado una base teórica sólida, productos comerciales maduros y una amplia gama de campos de aplicación, lo que atrae cada vez a más personas. se unieron los investigadores. El nacimiento y desarrollo de las bases de datos ha supuesto una gran revolución en la gestión de la información informática. Durante los últimos treinta años, se han desarrollado y construido miles de bases de datos en el país y en el extranjero. Las bases de datos se han convertido en la infraestructura para el trabajo, la producción y la vida diaria de empresas, departamentos e incluso individuos.
Al mismo tiempo, con la expansión y profundización de las aplicaciones, el número y la escala de las bases de datos están aumentando, y el campo de investigación de las bases de datos también se ha ampliado y profundizado enormemente. En los últimos 30 años, tres Turings informáticos (C.W. Bachman, E.F. Codd, J. Gray) han sido premiados en el campo de las bases de datos, lo que demuestra plenamente que las bases de datos son un campo lleno de vitalidad y espíritu innovador. Sigamos el desarrollo de las bases de datos a lo largo de la trayectoria histórica.
[Editar este párrafo] Una breve historia del desarrollo de las bases de datos
1. El nacimiento de la gestión de datos
La historia de las bases de datos se remonta a hace cincuenta años La gestión es muy sencilla. Los datos se procesaron pasando millones de tarjetas perforadas a través de una amplia gama de máquinas de clasificación, comparación y tabulación, y luego imprimiendo los resultados en papel o haciendo nuevas tarjetas perforadas. La gestión de datos es el almacenamiento físico y el procesamiento de todas esas tarjetas perforadas. Sin embargo, en 1951, Remington Rand Inc. En 1956, IBM produjo la primera unidad de disco, el modelo 305 RAMAC. En 1956, IBM produjo la primera unidad de disco, el modelo 305 RAMAC. Tiene 50 platos, cada uno de 2 pies de diámetro. y puede almacenar hasta 5 MB de datos. La mayor ventaja de utilizar discos es que se puede acceder a los datos de forma aleatoria, mientras que las tarjetas perforadas y las cintas sólo pueden acceder a los datos de forma secuencial.
1951: El sistema Univac utiliza cintas y. tarjetas perforadas para almacenar datos.
Las semillas de los sistemas de bases de datos aparecieron en la década de 1960. En ese momento, las computadoras comenzaron a usarse ampliamente para la gestión de datos y se propuso la idea de compartir datos. Para satisfacer cada vez más requisitos, los sistemas de archivos tradicionales no pueden satisfacer las necesidades de las personas. Han surgido sistemas de administración de bases de datos (DBMS) que pueden administrar y disfrutar los datos de manera uniforme. Según un determinado modelo de datos, los sistemas de bases de datos tradicionales generalmente se dividen en tres categorías: base de datos de red, base de datos jerárquica y base de datos relacional.
El primero en aparecer es el DBMS de red, que es Estados Unidos. Bachman y otros de General Electric Company desarrollaron con éxito IDS (Integrated DataStore) en 1961. En 1961, Charles Bachman de General Electric Co. desarrolló con éxito el primer DBMS de malla del mundo. El primer DBMS es también la base de datos más grande del mundo. Desarrolló con éxito el primer DBMS de malla del mundo y el primer sistema de gestión de bases de datos: Integrated DataStore IDS, sentando las bases para las bases de datos de malla. IDS fue la base de IDS y se difundió y aplicó ampliamente en ese momento. Sin embargo, solo podía ejecutarse en General Electric. mainframes, y la base de datos tenía un solo archivo, y todas las tablas de la base de datos tenían que crearse manualmente. Generación de código Más tarde, el cliente de GE, BF Goodrich Chemical Company, terminó teniendo que reescribir todo el sistema, que se denominó Sistema Integrado de Gestión de Datos. (IDMS).
Se adoptó el modelo de base de datos de red. Una simulación más natural de cosas jerárquicas y no jerárquicas. Antes de la aparición de las bases de datos relacionales, los DBMS de malla se usaban más comúnmente que los DBMS jerárquicos. En el desarrollo de bases de datos, las bases de datos en malla desempeñaron un papel importante.
Los sistemas de gestión de bases de datos aparecieron después de la aparición de las bases de datos en red. El sistema de bases de datos jerárquicas más famoso y típico es el IMS (sistema de gestión de información) desarrollado por IBM. 1968. Es una base de datos a gran escala desarrollada por IBM. Es el primer producto de programa de sistema de base de datos a gran escala desarrollado por IBM. Desde su creación a finales de la década de 1960, ha evolucionado hasta convertirse en IMSV6, que brinda soporte para funciones avanzadas como agrupación en clústeres, intercambio de datos de N vías y uso compartido de colas de mensajes. Este producto de base de datos de 30 años de antigüedad está desempeñando un nuevo papel en las aplicaciones de conectividad de aplicaciones WWW y de inteligencia empresarial de hoy.
En 1973, Cullinane Corporation (más tarde Cullinet Software Corporation) comenzó a vender una versión mejorada del IDMS de Goodrich y creció hasta convertirse en la empresa de software más grande del mundo en ese momento.
2. [Editar] Etapa de desarrollo de la base de datos
La etapa de desarrollo de la base de datos se divide aproximadamente en las siguientes etapas:
Etapa de gestión manual
<; p > Etapa del sistema de archivos;Etapa del sistema de base de datos
Etapa de base de datos avanzada.
[Editar]Estructura básica de la base de datos
La estructura básica de la base de datos se divide en tres niveles, lo que refleja tres perspectivas diferentes de mirar la base de datos.
(1) Capa de datos físicos.
Es la capa más interna de la base de datos y es una colección de datos realmente almacenados en dispositivos de almacenamiento físico. Estos datos son datos sin procesar, que son objetos procesados por el usuario y constan de cadenas de bits, caracteres y palabras procesadas mediante las operaciones de instrucción descritas por el esquema interno.
(2) Capa de datos conceptual.
Es la capa intermedia de la base de datos y la representación lógica general de la base de datos. Señale la definición lógica de cada dato y la conexión lógica entre los datos, que es una colección de registros almacenados. Se centra en la relación lógica de todos los objetos de la base de datos, más que en su situación física, y es una base de datos bajo el concepto de administrador de base de datos.
(3) Capa de datos lógica.
Es una base de datos vista y utilizada por los usuarios. Representa una colección de datos utilizados por un usuario específico o varios usuarios, es decir, una colección de registros lógicos.
Los vínculos entre las diferentes capas de la base de datos se transforman mediante el mapeo.
[Editar] Principales características de la base de datos
(1) Lograr el disfrute de los datos.
El disfrute de los datos incluye que todos los usuarios puedan acceder a los datos de la base de datos al mismo tiempo, y también incluye que los usuarios puedan usar la base de datos de múltiples maneras a través de la interfaz, proporcionando disfrute de los datos.
(2) Reducir la redundancia de datos.
En comparación con el sistema de archivos, debido a que la base de datos implementa seguridad de datos, evita que los usuarios creen archivos de aplicación ellos mismos. Reduzca una gran cantidad de datos duplicados, reduzca la redundancia de datos y mantenga la coherencia de los datos.
(3) Independencia de los datos.
La independencia de datos incluye que la estructura lógica de la base de datos en la base de datos y la aplicación son independientes entre sí, y también incluye que los cambios en la estructura física de los datos no afectan la estructura lógica de los datos. .
(4) Control centralizado de datos.
En el modo de gestión documental, los datos se encuentran en un estado disperso, y no existe relación entre diferentes usuarios o un mismo usuario procesa sus documentos de forma diferente. El uso de bases de datos puede controlar y administrar datos de manera centralizada y representar varias organizaciones de datos y conexiones entre datos a través de modelos de datos.
(5) Coherencia y mantenibilidad de los datos para garantizar la seguridad y confiabilidad de los datos.
Incluye principalmente: control de seguridad: para evitar la pérdida de datos, actualizaciones incorrectas y uso no autorizado ② Control de integridad: para garantizar la exactitud, validez y compatibilidad de los datos ③ Control de concurrencia: para permitir que los datos se procesen dentro; el mismo período de tiempo, permitiendo múltiples accesos a los datos y al mismo tiempo evitando interacciones anormales entre los usuarios ④ Descubrimiento y recuperación de fallas: un conjunto de métodos proporcionados por el sistema de administración de bases de datos
(6) Recuperación de fallas.
Un conjunto de métodos proporcionados por el sistema de gestión de bases de datos que pueden detectar y reparar fallas a tiempo para evitar que los datos se dañen. El sistema de base de datos puede recuperarse lo más rápido posible de fallas que ocurren en el funcionamiento del sistema de base de datos. Estas fallas pueden ser errores físicos o errores lógicos. Por ejemplo, errores de datos causados por un mal funcionamiento del sistema.
[Editar] Estructura de la base de datos y tipos de base de datos
Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos de red y bases de datos relacionales. Diferentes bases de datos están vinculadas y organizadas según diferentes estructuras de datos.
1. Modelo de estructura de datos
(1) Estructura de datos
La llamada estructura de datos se refiere a la organización de los datos o la relación entre datos. Si D representa datos y R representa el conjunto de relaciones que existen entre objetos de datos, entonces DS = (D, R) se denomina estructura de datos. Por ejemplo, hay una guía telefónica que registra los nombres y números de teléfono correspondientes de n personas.
Para que sea más fácil encontrar el número de teléfono de alguien, los nombres y números de teléfono están ordenados en el diccionario, con el nombre seguido del número de teléfono correspondiente. Entonces, para encontrar el número de teléfono de alguien (suponiendo que su nombre comience con Y), simplemente busque nombres que comiencen con Y. En este ejemplo, el conjunto de datos D son nombres y números de teléfono, la relación R entre ellos es el orden del diccionario y la estructura de datos correspondiente es DS = (D,R), que es una matriz.
(2) Tipos de estructuras de datos
Las estructuras de datos se dividen en estructuras lógicas de datos y estructuras físicas de datos. La estructura lógica de los datos consiste en observar y analizar datos desde una perspectiva lógica (es decir, la conexión entre los datos y la forma en que están organizados), independientemente de la ubicación de almacenamiento de los datos. La estructura física de los datos se refiere a la estructura de los datos almacenados en la computadora, es decir, la estructura lógica de los datos se implementa en forma de computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Aquí solo se estudia la estructura lógica de los datos, y el método para reflejar y realizar la conexión de datos se denomina modelo de datos.
Actualmente, existen tres modelos de datos populares, a saber, el modelo de estructura jerárquica y el modelo de estructura de red basado en la teoría de grafos, y el modelo de estructura relacional basado en la teoría de relaciones.
2. Estructura jerárquica, estructura de red y sistema de base de datos relacional
(1) Modelo de estructura jerárquica
El modelo de estructura jerárquica es esencialmente un árbol con nodos raíz A árbol ordenado dirigido (en matemáticas, un "árbol" se define como un gráfico conectado sin retornos). El siguiente diagrama muestra la estructura organizativa de una institución de educación superior. Esta estructura organizativa se compara vívidamente con un árbol. La escuela es la raíz del árbol (llamada nodo raíz), y cada departamento, especialidad, maestro, estudiante, etc. es la rama (llamada nodo raíz). El árbol y el punto de rama son Los bordes de conexión entre ellos se llaman bordes. La relación entre las raíces del árbol y los bordes es 1: N, es decir, solo hay una raíz de árbol y N ramas.
Un sistema de base de datos establecido según un modelo jerárquico se denomina sistema de base de datos de modelo jerárquico. IMS (Sistema de Gestión de la Información) es su representante típico.
(2) Modelo de estructura de red
Un sistema de base de datos establecido de acuerdo con una estructura de datos de red se denomina sistema de base de datos de red y su representante típico es DBTG (Grupo de tareas de base de datos). Las estructuras de datos de red se pueden convertir matemáticamente en estructuras de datos jerárquicas.
(3) Modelo de estructura relacional
La estructura de datos relacional simplifica algunas estructuras de datos complejas en relaciones binarias simples (es decir, forma bidimensional). Por ejemplo, la relación de los empleados en una unidad es una relación binaria.
Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.
En una base de datos relacional, la operación de los datos se basa casi en su totalidad en una o más formas relacionales, y los datos se procesan clasificando, fusionando, conectando o seleccionando estas formas relacionales. dBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como un problema de gestión de personal), a veces se necesitan múltiples relaciones para implementarlo. Otra función importante de dBASEII es crear archivos de comandos para realizar el uso y administración de la base de datos. Para un sistema de base de datos, el archivo de secuencia de comandos correspondiente se denomina sistema de aplicación de base de datos. Por tanto, se puede resumir que una relación se denomina base de datos y varias bases de datos pueden constituir un sistema de base de datos. Un sistema de base de datos puede derivar varios tipos de archivos auxiliares y establecer su sistema de aplicación.
[editar] Bases de datos de uso común
1. DB2 de IBM
Como pionero y líder en el campo de las bases de datos relacionales, IBM completó el sistema System R en Prototipo de 1977, y comenzó a proporcionar un servidor de base de datos integrado: System/38 en 1980, seguido de SQL/DSforVSE y VM, cuya versión inicial estaba estrechamente relacionada con el prototipo de investigación SystemR. DB2 para MVS proporcionó un sólido soporte de procesamiento de transacciones en línea (OLTP) en 1988 y soporte de bases de datos distribuidas a través de unidades de trabajo remotas en 1989 y unidades de trabajo distribuidas en 1993.
La última versión de DB2 Universal Database 6.1 es un modelo de base de datos universal. Es el primer sistema de gestión de bases de datos relacionales multimedia con capacidades en línea y admite varias plataformas, incluido Linux.
2. Oracle, anteriormente SDL, fue fundada en 1977 por Larry Ellison y otros dos programadores. Desarrollaron su propio producto estrella y lo vendieron en grandes cantidades. En 1979, lanzaron la primera base de datos comercial con relación SQL. sistema de gestión. Oracle es uno de los primeros desarrolladores de bases de datos relacionales y sus productos admiten la más amplia gama de plataformas de sistemas operativos. Actualmente, el producto de base de datos relacional de Oracle es uno de los productos con mayor cuota de mercado.
3. Informix
Informix se fundó en 1980 y ofrece productos de bases de datos relacionales especializados para sistemas operativos abiertos como Unix. El nombre de la empresa Informix proviene de una combinación de Information y Unix. El primer producto de base de datos relacional de Informix que realmente admite el lenguaje SQL es Informix SE (StandardEngine), que era el principal producto de base de datos en el entorno de microcomputadoras Unix en ese momento. También fue el primer producto de base de datos comercial que se portó a Linux.
4.Sybase
Sybase se fundó en 1984. El nombre de la empresa "Sybase" proviene de la combinación de "sistema" y "base de datos". Bob Epstein, uno de los fundadores de Sybase, es el diseñador principal de Ingres University Edition, un producto modelo de base de datos relacional desarrollado al mismo tiempo que System/R. El primer producto de base de datos relacional de la empresa fue Ingle University Edition, diseñado por Bob Epstein. El primer producto de base de datos relacional de la empresa fue Sybase SQLServer 1.0, lanzado en mayo de 1987. Sybase fue el primero en proponer la idea de una arquitectura de base de datos cliente/servidor y el primero en implementarla en Sybase SQLServer.
5.SQL Server
En 1987, Microsoft e IBM cooperaron para completar el desarrollo de OS/2. IBM incluyó el Administrador de bases de datos OS/2 en el sistema OS/2 ExtendedEdition. vendido, y la línea de productos de Microsoft todavía carece de productos de bases de datos. En 1989, Microsoft lanzó la versión 1.0 de SQL Server basada en la plataforma OS/2.
6. PostgreSQL
PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos (ORDBMS) de software libre y completo. Muchas de sus características son las predecesoras de muchas bases de datos comerciales actuales. PostgreSQL comenzó originalmente como el proyecto Ingres en BSD, con funcionalidades que abarcaban SQL-2/SQL-92 y SQL-3. En primer lugar, admite los tipos de datos más ricos del mundo actual; en segundo lugar, PostgreSQL es actualmente el único sistema de gestión de bases de datos que admite transacciones, subconsultas, sistemas de control paralelos de múltiples versiones y comprobaciones de integridad de datos. Es un sistema de gestión de bases de datos de software libre.
7. mySQL
mySQL es un pequeño sistema de gestión de bases de datos relacionales desarrollado por la empresa sueca MySQL AB. Fue adquirida por Sun el 16 de enero de 2008. Actualmente, MySQL se utiliza ampliamente en sitios web pequeños y medianos en Internet. Debido a su pequeño tamaño, alta velocidad, bajo costo total de propiedad y especialmente su naturaleza de código abierto, muchos sitios web pequeños y medianos eligen MySQL como su base de datos para reducir el costo total de propiedad del sitio web. El sitio web oficial de MySQL es www.mysql.com
8. La base de datos Access es un sistema de gestión de bases de datos para microcomputadoras lanzado por Microsoft en 1994.
Tiene las características de interfaz amigable, fácil de aprender y usar, desarrollo simple, interfaz flexible, etc. Es un típico sistema de gestión de bases de datos de escritorio de nueva generación. Sus características principales son las siguientes:
(1) Gestiona perfectamente varios objetos de bases de datos, con potentes funciones de organización de datos, gestión de usuarios, inspección de seguridad y otras funciones.
(2) Potentes capacidades de procesamiento de datos en un entorno de red a nivel de grupo de trabajo, el sistema de administración de bases de datos multiusuario desarrollado con Access tiene clientes que el sistema de base de datos tradicional XBASE (DBASE, FoxBASE) no puede lograr. Estructura ordenador-servidor (Cliente/Servidor) y correspondiente mecanismo de seguridad de la base de datos. Access tiene muchas características avanzadas de los grandes sistemas de gestión de bases de datos, como capacidades de procesamiento de transacciones/reversión de errores.
(3) Se pueden generar fácilmente varios objetos de datos y se pueden crear formularios e informes utilizando datos almacenados con buena visibilidad.
(4) Como parte de la suite Office, se puede integrar con Office para lograr una conexión perfecta.
(5) La Web se puede utilizar para recuperar y publicar datos para conectarse a Internet. El acceso está pensado principalmente para aplicaciones pequeñas y medianas, o como una base de datos de cliente en un sistema cliente/servidor.
9.Base de datos FoxPro
FoxPro fue lanzado originalmente por American Fox Company en 1988 y fue adquirido por Microsoft en 1992. Posteriormente, se lanzaron FoxPro2.5, 2.6 y VisualFoxPro. El rendimiento ha mejorado mucho. FoxPro2.5 y 2.6 se dividen en dos versiones: DOS y Windows, ejecutándose en entornos DOS y Windows respectivamente. FoxPro ha mejorado enormemente sus funciones y rendimiento en comparación con FoxBASE, principalmente mediante la introducción de controles como ventanas, botones, cuadros de lista y cuadros de texto, lo que mejora aún más las capacidades de desarrollo del sistema.