Red de conocimiento informático - Material del sitio web - Características básicas del big data

Características básicas del big data

Big data se caracteriza por diversos tipos de datos, densidad de valor de datos relativamente baja, velocidad de procesamiento rápida y altos requisitos de puntualidad. Big data se refiere a activos de información masivos, de alto crecimiento y diversos que no pueden ser capturados, administrados y procesados ​​por herramientas de software convencionales dentro de un cierto período de tiempo. Se necesitan nuevos modelos de procesamiento para tener una toma de decisiones, conocimientos y descubrimiento más sólidos. Capacidades de optimización de procesos.

1. Características de big data

1. Múltiples tipos de datos: mayores requisitos para las capacidades de procesamiento de datos, como registros web, audio, video, imágenes e información de ubicación geográfica y otros. tipos de datos.

2. Velocidad de procesamiento rápida y alta puntualidad: a diferencia de la minería de datos tradicional, esta es también la característica más importante del big data.

3. La densidad del valor de los datos es relativamente baja: con la aplicación generalizada de Internet de las cosas, la percepción masiva de información y la información son ubicuas, pero la densidad del valor es baja. El problema urgente que debe resolverse en la era del big data es: cómo "purificar" el valor de los datos más rápidamente mediante potentes algoritmos automáticos.

2. Cuatro características principales del big data

1. Masa: Según un informe reciente de IDC, la cantidad de datos globales se expandirá 50 veces en 2020. Ahora bien, la escala del big data siempre ha sido un indicador cambiante, y el tamaño de un único conjunto de datos puede variar desde decenas de terabytes hasta varios petabytes. En otras palabras, almacenar 1 petabyte de datos requiere 20.000 computadoras personales con discos duros de 50 GB. Además, los datos pueden generarse a partir de muchas fuentes inesperadas.

2. Alta velocidad: se refiere a la velocidad de creación y movimiento de datos. En la era de las redes de alta velocidad, la creación de flujos de datos en tiempo real se ha convertido en una tendencia popular, principalmente a través de procesadores y servidores informáticos de alta velocidad que optimizan el rendimiento del software. Las empresas generalmente necesitan saber cómo crear datos rápidamente y también cómo procesarlos, analizarlos y devolverlos rápidamente a los usuarios para satisfacer algunas de sus necesidades.

3. Diversidad: La diversidad de datos aumenta debido a los nuevos datos multiestructurados. También incluye tipos de datos como registros web, redes sociales, registros de llamadas de teléfonos móviles, búsquedas en Internet y redes de sensores.

4. Variabilidad: Los macrodatos adoptan muchas formas y tipos porque tienen una estructura de varias capas. En comparación con los datos comerciales tradicionales, los big data tienen irregularidades y confusión, lo que hace que sea difícil o incluso imposible que el software de aplicación tradicional los analice. Los datos comerciales tradicionales tienen un formato estándar que puede ser reconocido por el software de inteligencia empresarial estándar. Hoy en día, procesar y extraer valor de diversas formas de datos complejos se ha convertido en un desafío para las empresas.