¿Cuáles son las principales características de la era del big data?
El big data tiene cuatro características, a saber: Volumen, Variedad, Velocidad y Valor: Volumen, Variedad, Velocidad y valor (Valor), generalmente llamado 4V.
1. Las características de big data se reflejan primero en "big". Desde la era Map3 inicial, un Map3 pequeño de nivel MB puede satisfacer las necesidades de muchas personas, pero con el paso del tiempo, unidades de almacenamiento. han oscilado entre GB y TB en el pasado, e incluso hasta niveles de PB y EB en la actualidad.
Con el rápido desarrollo de la tecnología de la información, los datos han comenzado a crecer de manera explosiva. Las redes sociales (Weibo, Twitter, Facebook), las redes móviles, diversas herramientas inteligentes, herramientas de servicios, etc. se han convertido en fuentes de datos. Los casi 400 millones de miembros de Taobao generan aproximadamente 20 TB de datos de transacciones de productos básicos cada día; los aproximadamente mil millones de usuarios de Facebook generan más de 300 TB de datos de registro cada día.
Necesitamos urgentemente algoritmos inteligentes, potentes plataformas de procesamiento de datos y nuevas tecnologías de procesamiento de datos para contar, analizar, predecir y procesar datos de gran escala en tiempo real.
2. Diversidad. La amplia gama de fuentes de datos determina la diversidad de formas de big data. Cualquier forma de datos puede desempeñar un papel. Los más utilizados son los sistemas de recomendación, como Taobao, NetEase Cloud Music, Toutiao, etc. Estas plataformas analizarán los datos de registro de los usuarios para recomendar más cosas que les gusten.
Los datos de registro son datos claramente estructurados. Algunas estructuras de datos no son obvias, como imágenes, audios, videos, etc. Estos datos tienen relaciones causales débiles y requieren anotaciones manuales.
3. Los big data se generan muy rápidamente y se transmiten principalmente a través de Internet. Todos en la vida son inseparables de Internet, lo que significa que las personas proporcionan grandes cantidades de información a big data todos los días.
Y estos datos deben procesarse de manera oportuna, porque es muy antieconómico gastar mucho dinero para almacenar datos históricos que son de poca utilidad para una plataforma, que tal vez solo pueda hacerlo. Guarde los últimos días o un mes, no importa qué tan lejos estén los datos, debe limpiarlos a tiempo, de lo contrario el costo será demasiado alto.
En base a esta situación, Big Data tiene requisitos muy estrictos en cuanto a la velocidad de procesamiento. Se utiliza una gran cantidad de recursos en el servidor para procesar y calcular datos, y muchas plataformas requieren análisis en tiempo real. Los datos se generan todo el tiempo y quien sea más rápido tendrá ventaja.
4. Ésta es la característica central del big data. Sólo una pequeña parte de los datos generados en el mundo real tiene valor.
En comparación con los pequeños datos tradicionales, el mayor valor de los grandes datos es extraer una gran cantidad de datos irrelevantes de varios tipos y utilizar métodos de aprendizaje automático, métodos de inteligencia artificial o métodos de minería de datos para realizar análisis en profundidad. Generar datos valiosos para predecir y analizar tendencias y patrones futuros.
Descubra nuevas leyes y nuevos conocimientos y aplíquelos en diversos campos, como la agricultura, las finanzas y la atención médica, logrando en última instancia los efectos de mejorar la gobernanza social, aumentar la productividad y avanzar en la investigación científica.