¿Cuál es la composición de las filas de la tabla de datos en hase?
La composición de las filas en la tabla de datos en hbase se presenta de la siguiente manera:
Una fila en HBase contiene una ("Clave; valor clave") y ("uno o más ") Columna que contiene valores.
En HBase, la estructura organizativa de la tabla de datos es diferente a la de las bases de datos relacionales tradicionales. Para comprender mejor la estructura de las tablas de datos de HBase, primero podemos revisar cómo se procesan las tablas en las bases de datos relacionales. Por ejemplo, en una tabla de usuario user_info, hay campos: id, nombre, tel. Estos nombres y campos de tabla deben especificarse al crear la tabla.
Pero en HBase, las filas de la tabla de datos se componen de varias familias de columnas, y cada familia de columnas tiene muchas columnas. La familia de columnas es la unidad más pequeña de almacenamiento de datos en HBase y la columna es la unidad más pequeña de la familia de columnas. Puede haber varias columnas en cada familia de columnas y cada columna puede almacenar varias versiones de datos. Por lo tanto, la tabla de datos en HBase se compone de varias familias de columnas y varias columnas.
Este diseño hace que HBase sea altamente flexible y escalable, pudiendo adaptarse a las necesidades de almacenamiento de datos masivos. Pero al mismo tiempo, debido a que HBase no admite operaciones de transacciones, se debe prestar especial atención a la coherencia e integridad de los datos al usarlos.
Introducción a hbase:
HBase es una base de datos distribuida no relacional de código abierto, que se refiere a la implementación de modelado BigTable de Google y utiliza Java como lenguaje de programación. Es parte del proyecto Hadoop de Apache Software Foundation, se ejecuta en el sistema de archivos HDFS y proporciona servicios similares a la escala de BigTable para Hadoop.
HBase es una base de datos no relacional NoSQL que no se ajusta al paradigma de las bases de datos relacionales. Es adecuada para almacenar datos semiestructurados y no estructurados, como datos dispersos y datos vacíos. no ocupar espacio de almacenamiento. Es un sistema de almacenamiento distribuido altamente confiable, de alto rendimiento, orientado a columnas y escalable que puede implementar adiciones, eliminaciones, modificaciones y consultas en tiempo real.
En la estructura lógica de HBase, cada dato debe tener una clave de fila, y la clave de fila se puede consultar a través de la clave de fila. Hay tres formas de acceder a los datos en HBase: mediante una única clave de fila, mediante un conjunto de claves de fila o mediante una celda formada por la intersección de filas y columnas. Cada celda almacena múltiples versiones de un dato y las versiones se distinguen por marcas de tiempo. Los datos se almacenan en formato binario, sin diferencia en el tipo de datos. Todos los datos vacíos no ocupan espacio.
HBase usa Hadoop HDFS como sistema de almacenamiento de archivos, usa MapReduce de Hadoop para procesar datos masivos en HBase y usa Zookeeper como herramienta de coordinación. Se puede utilizar para almacenar datos masivos, tiene un rendimiento potente y puede implementar consultas a nivel de milisegundos de cientos de millones de registros, pero no puede proporcionar un control estricto de las transacciones. En general, HBase es un clúster de almacenamiento estructurado a gran escala que se puede construir en una PC económica.