Red de conocimiento informático - Material del sitio web - ¿Cuál es la tendencia de desarrollo de las bases de datos distribuidas de big data (ventajas de las bases de datos distribuidas)?

¿Cuál es la tendencia de desarrollo de las bases de datos distribuidas de big data (ventajas de las bases de datos distribuidas)?

Hoy en día, big data es una tecnología muy popular, lo que hace que muchas personas presten atención a cualquier desarrollo de big data, porque big data afectará nuestras vidas hasta cierto punto. Este artículo le presentará las tendencias de desarrollo de las bases de datos distribuidas de big data. Espero que este artículo pueda ayudarlo a comprender mejor las tendencias de desarrollo de las bases de datos distribuidas de big data.

De hecho, ya sea Hadoop o una base de datos distribuida, su sistema técnico se está desarrollando en la dirección de separar la capa informática y la capa de almacenamiento. Esta tendencia es muy obvia para Hadoop, donde el almacenamiento HDFS y los cálculos de programación de YARN están separados, lo que permite que el cálculo y el almacenamiento se amplíen según demanda. En los últimos años, las bases de datos distribuidas han mostrado una tendencia similar, y muchas bases de datos eliminan el almacenamiento subyacente y los motores SQL de capa superior. Las bases de datos XML tradicionales, las bases de datos OO y los antiguos RDBMS están desapareciendo; la influencia de campos emergentes como las bases de datos de documentos, las bases de datos de gráficos, las bases de datos tabulares y las bases de datos multimodelo se está expandiendo; Las bases de datos se están considerando como transformación. Se puede ver que Hadoop aún se encuentra en una etapa relativamente temprana en términos de integridad y madurez técnica. Hasta hoy, muchas tecnologías requerían un ajuste manual exhaustivo en muchas aplicaciones empresariales para que funcionaran. Al mismo tiempo, los principales escenarios de aplicación de Hadoop siempre han sido las empresas de análisis por lotes, y la parte de procesamiento en línea de las bases de datos tradicionales no es la dirección principal de su desarrollo. Al mismo tiempo, el ecosistema de código abierto de la tecnología Hadoop es demasiado grande y hay demasiados fabricantes involucrados en la transformación, lo que dificulta que los usuarios estén completamente familiarizados con todo el sistema. Esto aumenta enormemente la complejidad del desarrollo. Por otro lado, el mantenimiento de diferentes versiones por parte de los fabricantes puede aumentar gradualmente la diferencia entre la dirección de desarrollo del producto y la versión de código abierto.

Aunque el campo de las bases de datos distribuidas se ha perfeccionado durante décadas, la tecnología tradicional RDBMS MPP se ha vuelto cada vez más perfecta. Entre las clasificaciones de muchas bases de datos distribuidas, la principal dirección de desarrollo se puede dividir en "bases de datos distribuidas en línea". y "Base de datos de análisis distribuido". Las principales direcciones de desarrollo de las bases de datos distribuidas se pueden dividir básicamente en dos tipos: "bases de datos distribuidas en línea" y "bases de datos analíticas distribuidas". Al comparar Hadoop y las bases de datos distribuidas, podemos ver que la dirección de desarrollo del producto de Hadoop coincide con la base de datos de almacenamiento en columnas en las bases de datos distribuidas. En escenarios de transacciones en línea de alta concurrencia, a excepción de HBase de Hadoop, que apenas puede tocar el borde, las bases de datos distribuidas ocupan Absolute. ventaja. En la actualidad, a juzgar por el desarrollo de la industria Hadoop, muchos fabricantes preferirían transformarse en proveedores de servicios de ciencia de datos y aprendizaje automático. Por lo tanto, desde la perspectiva del modelo de negocio, el modelo de negocio de distribución de Hadoop básicamente ha llegado a su fin. Los usuarios se han dado cuenta de la dificultad de mantener toda la plataforma Hadoop y no están dispuestos a verse obligados a comprar la plataforma completa. Una gran cantidad de usuarios prefieren dividir los componentes originales de Hadoop y usarlos de manera flexible, pagando por escenarios de uso y resultados en lugar de pagar por la plataforma en sí. Otro segmento del mercado, el almacenamiento de archivos pequeños no estructurados, siempre ha sido el principal campo de batalla para el almacenamiento de objetos, el almacenamiento en bloques y los sistemas de archivos distribuidos. Ahora, algunas bases de datos de nueva generación están comenzando a ingresar a este campo. Es previsible que en los próximos años el almacenamiento de archivos pequeños no estructurados también pueda convertirse en uno de los campos de batalla para las bases de datos distribuidas con capacidades de procesamiento de datos multimodales.

En este artículo, le presentamos mucha información sobre las perspectivas de desarrollo de las bases de datos distribuidas de big data. A través de este artículo, podemos encontrar fácilmente que el desarrollo de bases de datos es un contenido extremadamente importante. Construyendo una base de datos distribuida, ¿podemos Big data puede servirnos mejor?