¿Cuáles son las características del big data?
Con el rápido desarrollo de la tecnología de la información, los datos han comenzado a crecer explosivamente. Los datos en big data ya no se miden en gigabytes o terabytes, sino en petabytes (1.000 t), exabytes (10.000 t) o ZB (100 millones de t).
2. Diversidad
La diversidad se refleja principalmente en tres aspectos: múltiples fuentes de datos, múltiples tipos de datos y una fuerte correlación entre los datos.
Existen muchas fuentes de datos y los datos tradicionales a los que se enfrentan las empresas son principalmente datos de transacciones. El desarrollo de Internet y la IoT ha aportado datos de diversas fuentes, como sensores y sitios de redes sociales.
Dado que los datos provienen de diferentes sistemas de aplicaciones y diferentes dispositivos, la diversidad de formas de big data está determinada. Generalmente, se pueden dividir en tres categorías: en primer lugar, datos estructurados, como datos del sistema financiero, datos del sistema de gestión de la información, datos del sistema médico, etc. , que se caracteriza por fuertes relaciones causales entre los datos; el segundo son datos no estructurados, como videos, imágenes, audio, etc. , caracterizados por la ausencia de relación causal entre datos; terceros, datos semiestructurados, como documentos HTML, correos electrónicos, páginas web, etc. , caracterizado por una relación causal débil entre los datos.
Hay muchos tipos de datos, y los datos no estructurados son los datos principales. En las empresas tradicionales, los datos se almacenan en forma de tablas. Los big data de 70-85 son datos no estructurados y semiestructurados, como imágenes, audios, videos, registros web e información de enlaces.
Los datos tienen una fuerte correlación con las interacciones frecuentes. Por ejemplo, las fotos y los registros subidos por los turistas durante sus viajes tienen una fuerte correlación con la ubicación, el itinerario y otra información de los turistas.
3. Alta velocidad
Esta es la característica más importante que distingue el big data de la minería de datos tradicional. La diferencia importante entre big data y big data radica en dos aspectos: por un lado, la escala de datos de big data es mayor y, por otro lado, big data tiene requisitos más estrictos en cuanto a la velocidad de respuesta del procesamiento de datos; El análisis en tiempo real reemplaza el análisis por lotes, y la entrada, el procesamiento y el descarte de datos son inmediatos y casi sin demora. La tasa de crecimiento y la velocidad de procesamiento de los datos son manifestaciones importantes de la alta velocidad del big data.
4. Valor
Aunque las empresas tienen una gran cantidad de datos, sólo una parte muy pequeña es valiosa. El valor que se esconde detrás del big data es enorme. Debido a que la proporción de datos valiosos en big data es muy pequeña, el valor real de big data se refleja en una gran cantidad de diversos tipos de datos irrelevantes. Extraer datos valiosos para la predicción y el análisis de tendencias y patrones futuros, realizar análisis en profundidad a través de métodos de aprendizaje automático, métodos de inteligencia artificial o métodos de minería de datos, y aplicarlos a la agricultura, las finanzas, la medicina y otros campos, para crear mayor valor. .