¿Qué significa 4V 1O de big data?
Características del big data (4V 1O):
Gran cantidad de datos (Volumen). La primera característica es la gran cantidad de datos, incluida la cantidad de recopilación, almacenamiento y cálculo. La unidad de medida inicial para big data es al menos P (1000 terabytes), E (1 millón de terabytes) o Z (1000 millones de terabytes).
Diversidad. La segunda característica es la diversidad de tipos y fuentes. Incluyendo datos estructurados, semiestructurados y no estructurados, representados por registros de red, audio, video, imágenes, información de ubicación geográfica, etc. La diversidad de tipos de datos plantea mayores requisitos para las capacidades de procesamiento de datos.
Baja densidad de valor (Value). La tercera característica es que la densidad de valor de los datos es relativamente baja, que es el valor de los datos. Con la aplicación generalizada de Internet e Internet de las cosas, la percepción de la información es ubicua y la información es masiva, pero la densidad de valor es baja. Cómo combinar la lógica empresarial y extraer el valor de los datos a través de potentes algoritmos automáticos es el problema más importante. por resolver en la era del big data.
Velocidad. La cuarta característica es que los datos crecen rápidamente, la velocidad de procesamiento también es rápida y los requisitos de puntualidad son altos. Por ejemplo, los motores de búsqueda requieren varios minutos antes de que los usuarios puedan consultar las noticias, y los algoritmos de recomendación personalizados requieren recomendaciones en tiempo real tanto como sea posible. Esta es una característica importante del big data que la diferencia de la minería de datos tradicional.
Los datos están en línea. Los datos siempre están en línea y se pueden llamar y calcular en cualquier momento. Esta es la característica más importante que distingue los big data de los datos tradicionales. Los grandes datos de los que estamos hablando ahora no solo son grandes, sino que, lo que es más importante, los datos se han vuelto en línea. Esta es una característica del rápido desarrollo de Internet. Por ejemplo, en las herramientas de llamada de taxis, los datos de los clientes y los datos de los taxistas están todos en línea en tiempo real. Sólo esos datos son significativos. Si se colocan en un disco o se desconectan, el valor de los datos es mucho menor que el valor comercial en línea.