El futuro de las bases de datos
Quizás no creas lo que harán los productos de gestión de datos del futuro, así que comencemos con algunas características nuevas de la base de datos actual. Un joven llega al hospital con una forma relativamente rara de influenza. es el Médico Examinador de la Semana Se encontró un tercer caso similar y necesitaba más información. El médico confundido tomó una muestra de sangre y ordenó algunos otros procedimientos. Luego se sentó frente a la computadora y ordenó (a través de una interfaz gráfica de usuario simple). ) una serie de análisis de muestras de sangre y comparó los resultados con pacientes con síntomas similares en todo el mundo. También solicitó una recuperación de registros de diagnósticos, tratamientos y resultados de pacientes con condiciones similares a las del joven. Centros para el Control y la Prevención de Enfermedades (CDC) para obtener información relevante sobre el desarrollo de la afección. A los pocos minutos del mensaje, los médicos encontraron una cura para esta gripe inusual para otros pacientes. ¿Podría ser posible este escenario hoy, como lo ha hecho la gripe recientemente? ¿Se propaga en algunas ciudades con niveles graves de contaminación? Es posible (si contamos con el conjunto de herramientas de simulación y análisis científico adecuado), pero conlleva el costo del desarrollo avanzado de aplicaciones y la configuración del sistema. La gestión de datos ya ha evolucionado para hacer factibles escenarios similares, y los sistemas se están integrando más rápido y mejor. Más fácil de usar al mismo tiempo que aumenta la funcionalidad, la escalabilidad y la distribución. En este artículo, analizaré lo que se avecina para la industria de la gestión de datos en los próximos años y las complejidades que impulsan cada vez más el desarrollo de DB-first. Las nuevas regulaciones están cambiando los modelos de negocios. estar conectados para generar informes como fusiones y adquisiciones obligan a la integración de procesos comerciales (análisis de riesgos) y datos (información del cliente). Las diferentes unidades de negocios deben compartir información para obtener nuevos puntos de crecimiento de ingresos, y las empresas también deben intercambiar información con socios comerciales. El comercio global significa administrar bases de datos distribuidas y brindar disponibilidad las 24 horas del día, los 7 días de la semana. Los costos siguen siendo altos. El aumento de la presión competitiva obliga a las empresas a operar de manera más eficiente. tareas al gestionar datos A medida que aumentan los desafíos que plantea, la importancia de la información se ha elevado a un nivel sin precedentes. La información en diversas formas (bases de datos, hojas de cálculo, sistemas de gestión de documentos, archivos de texto, páginas web, gráficos e imágenes). convertirse en el activo más común de la empresa. Por lo tanto, la necesidad de administrar datos de bases de datos y otras fuentes es cada vez mayor, así como de proporcionar a los usuarios empresariales no expertos en TI formas más fáciles de acceder a estos datos. Se deben procesar más análisis y no hay espacio para respirar. Se espera que todos los elementos de gestión de datos sigan mejorando. La investigación sobre las velocidades de carga y recuperación seguirá liderando el camino. La investigación sobre el acceso rápido a datos incluye nuevos tipos de índices (como estructuras de índices universales que pueden adaptarse rápidamente a nuevos tipos de datos) Utilice agrupaciones multidimensionales para acelerar el acceso a datos multidimensionales. Esta tecnología se ha aplicado en DB Universal Database (UDB) v y se aplicará. Continúe utilizándose en versiones posteriores. IBM continúa desarrollando diferentes soluciones de almacenamiento para aumentar la velocidad de agrupación de datos y fortalecer la capacidad de control de objetos grandes. También se están realizando consultas eficientes de grandes cantidades de datos para resolver el procesamiento eficiente y complejo. consulta de datos empresariales masivos Por ejemplo, IBM Almaden Research Center ha desarrollado un nuevo método que utiliza el muestreo para obtener un subconjunto aleatorio de datos y estimar o extrapolar la solución basándose en esa muestra, lo que permite al sistema proporcionar soluciones aproximadas a consultas complejas con mayor rapidez. Esta técnica se ha aplicado en DB UDB v Test Base. El muestreo dará mejores resultados más rápido. La información estadística ayuda con la optimización y también se están realizando diferentes mejoras en el diseño para mejorar el rendimiento de las consultas con una gran cantidad de subconsultas y operaciones complejas. como uniones externas y antiuniones) y se espera que se publiquen en algún momento.
Las listas de consultas materializadas (MQT), un gran avance para este tipo de consultas, pueden adoptarse más ampliamente para almacenar respuestas precalculadas a consultas de alta frecuencia. Las MQT ya están disponibles y se están ampliando para almacenar respuestas de consultas más generales. Por ejemplo, DB v puede almacenar resultados relacionados incluso si no hay ningún agregado en la consulta. Los motores de consulta pueden decidir mejor de forma autónoma cuándo usar las MQT. Las respuestas a las consultas actuales se utilizan para indicarle al sistema cuándo crear las MQT. En el futuro, los sistemas de bases de datos podrán crear MQT de forma autónoma y se utilizarán en la indexación (como la recuperación relacionada) y el almacenamiento en caché de resultados comunes. Cuando se utilicen para conectarse a datos remotos (se ha adoptado v), MQT desempeñará un papel más importante en la memoria compartida de gran tamaño. y los multiprocesadores no compartidos obtendrán más datos divididos (particiones). Los nuevos algoritmos para seleccionar y procesar consultas mejorarán la disponibilidad. La presión empresarial requiere sistemas de reserva en caliente de alta disponibilidad para adaptarse a más entornos. configuraciones de alta gama y se volverán más populares. En resumen, los usuarios pueden cambiar de un servidor a otro. Se asumen una serie de compromisos de calidad del servicio para seleccionar las compensaciones requeridas entre rendimiento, disponibilidad y costo, mientras que la investigación y los desarrolladores lo harán. Esas compensaciones son más fáciles de lograr mediante el uso de hardware redundante reducido e información de respaldo. Hoy en día, se ha escrito mucho sobre la necesidad de comercio electrónico y modelos de negocios distribuidos con corrección automática. Cada vez más empresas utilizan servidores web para realizar transacciones comerciales en Internet utilizando una combinación compleja de JEE NET y XML. La recuperación de datos dentro y fuera de este entorno a menudo requiere que interfaces como JDBC implementen el acceso a los datos y conviertan los resultados a XML y luego empaqueten el XML. Como respuesta de servicio web, actualmente es posible transferir datos de esta manera, pero de hecho es algo tedioso. En el futuro, las bases de datos se integrarán más directamente en la Web, lo que la convertirá en un componente integrado de gestión de datos y servicios web. bases de datos para infraestructura de aplicaciones. Un proveedor de servicios web ya responde a las solicitudes a través de una interfaz de servicios web. Pronto también se convertirá en un consumidor de servicios web, lo que significa que durante una consulta puede llamar al servicio web para devolver toda la información requerida. Por ejemplo, en una única consulta, el usuario puede buscar una pieza que contenga la descripción del estado del almacenamiento local, el proveedor preferido (de diferentes listas locales), la disponibilidad y la información sobre el precio (hace una solicitud al proveedor a través de un servicio web y devuelve la información actual) DB Esta capacidad se ha demostrado durante mucho tiempo. Actualmente, debe llamar explícitamente al servicio web en la declaración SQL a través de una función definida por el usuario. En el futuro, incluso puede tratar el servicio web como un alias de una lista, lo que permite un acceso transparente a la aplicación. Herramientas de desarrollo e implementación La base del soporte XML para la integración de datos y procesamiento desarrollado a través de la tecnología es el soporte estable para XML, incluido el soporte para XML como tipo de datos básico. XML Extender permite a los usuarios guardar y recuperar datos XML a través de él. XML En el futuro, IBM introducirá más información en el motor. Gran parte de este soporte está disponible para optimizar el acceso. Los datos relacionales ahora se pueden devolver en forma de archivos XML a través de extensiones estandarizadas del lenguaje SQL (SQL/XML). Esto permite que los datos intercambiados se devuelvan en los tipos necesarios para el intercambio de datos en empresas de comercio electrónico. Los documentos se pueden almacenar de forma segura en un RDBMS. Bases de datos bilingües. Aunque XML claramente se convertirá en el estándar para el intercambio de datos de comercio electrónico, las bases de datos relacionales no lo harán. Las bases de datos sólo XML no pueden reemplazar los sistemas relacionales ubicuos. Parte del problema es que todos los datos deben transformarse. El gasto requerido también se debe en parte al surgimiento de tecnologías relacionales más maduras que las bases de datos XML. podrán proporcionar capacidades relacionales integrales y verdadero soporte nativo para XML. Tendrán herramientas de recuperación y administración de almacenamiento habilitadas para XML integradas en el motor. Además, se pueden utilizar consultas en lenguaje XML, XQuery y SQL. utilice tanto relacional como XML según sea necesario.
Ventajas de implementar sus mejores prácticas El equipo de IBM Xperanto está trabajando en la integración de información de datos distribuidos. Ha aprendido cómo los servicios XML y web pueden ayudarlo a lidiar con modelos de negocios distribuidos complejos. Proporcionan una integración de datos distribuidos entre diferentes aplicaciones o. Las empresas actuales suelen estar muy distribuidas. Una determinada función puede estar distribuida en varias ubicaciones. Una gran empresa farmacéutica puede tener operaciones en varios países diferentes. Los científicos de los laboratorios de investigación necesitan compartir información experimental y de simulación. El equipo de desarrollo de gestión de datos de IBM está distribuido en siete ubicaciones en cuatro países, y también hay desarrolladores de instituciones de investigación relacionados en otros lugares del mundo. Las especificaciones técnicas requeridas, el estado del código y la información deben compartirse entre estos diferentes sitios de trabajo. Las organizaciones elegirán diferentes infraestructuras. En algunas industrias donde prevalecen las fusiones y adquisiciones, los departamentos funcionalmente equivalentes tienen una infraestructura de TI completamente diferente. Esto no es raro que las operaciones comerciales aún requieran que la información se comparta entre estas regiones y sistemas dispares. de mecanismos para la integración de información, incluida la integración basada en aplicaciones. El enfoque más común para la integración de información es probablemente mediante el uso de aplicaciones especializadas. Acceso cableado a recursos de interés y luego fusión manual de resultados de consultas. Marcos de integración de aplicaciones. Flujo de trabajo de integración de procesos de negocio. Los sistemas, así como los servicios web, brindan a los programadores servicios de extracción avanzados que les permiten obtener fácilmente datos de fuentes adicionales. Por supuesto, fusionar los datos (es decir, ejecutar la correlación) aún requiere programación manual. Almacenes de datos centralizados. Para aplicaciones que requieren análisis complejos, muchas empresas optan por extraer (copiar) los datos requeridos en un almacén de datos separado (centro de datos). Esto permite que SQL se dedique completamente al análisis y no hay necesidad de procesar datos dispersos a través de aplicaciones. La federación de datos crea una base de datos virtual. Puede ingresar al almacén de datos. A veces los datos cambian demasiado rápido. A veces los datos no son propiedad de la empresa (como sus socios comerciales o una organización de servicios de información). A veces los datos están en el formato incorrecto y no se pueden almacenar. o buscar en un sistema de base de datos relacional. Aquí es donde entran en juego los almacenes de datos de base de datos y los centros de datos. La excelente tecnología de IBM puede integrar esas fuentes de datos distribuidas heterogéneas. La federación de datos facilita a los usuarios consultar datos distribuidos como si estuvieran unidos. Las aplicaciones almacenadas en una sola base de datos se vuelven más fáciles y tienen la funcionalidad de una sola base de datos sin el costo de replicación y mantenimiento. Aplicaciones a través de la federación de datos. Los datos subyacentes se pueden almacenar en la consulta para que estas funciones no se vuelvan a ejecutar (serían). ejecutado si los datos realmente se movieron). La federación de datos agrega un componente entre la aplicación cliente y los datos: una capa especial que equilibra el rendimiento. Durante el proceso de consulta, los datos almacenados en diferentes puntos (sin fusionarse) pueden causar retrasos en la red. La función de súper optimización de Dongfeng Data Union hace que la integración de datos entre múltiples aplicaciones sea más eficiente y simple. En el futuro, es muy posible que la integración de información de varios modelos se convierta en un tema candente para la mayoría de las empresas, es posible que vea diferentes tecnologías. madurar y converger La solución a un problema de integración particular implicará el almacenamiento de datos (para datos críticos que se pueden almacenar en sistemas relacionales) y la federación de datos (para la integración entre datos no adecuados para almacenes de datos). fuentes de datos dispares y al mismo tiempo se simplifica el proceso de relacionar datos juntos lishixinzhi/Article/program/Oracle/201311/18553