Cómo los estudiantes universitarios utilizan big data para construir el socialismo
Actualmente no existe una definición clara de big data. La definición de Wikipedia de big data es: Big data se refiere a la enorme cantidad de datos involucrados que no se pueden interceptar, administrar, procesar y organizar en un tiempo razonable a través de las herramientas de software convencionales actuales para lograr un resultado más positivo Propósito de ayudar a las decisiones comerciales 1. . En el libro "Big Data", Xu Zipei define big data como: datos cuya escala ha excedido el sentido tradicional y es difícil de capturar, almacenar, gestionar y analizar para las herramientas de software generales. 2 Victor Tomeier Schonberg, autor del libro "La era de los grandes datos", cree: "Los grandes datos son cosas que la gente puede hacer con datos a gran escala y que la gente no puede hacer con datos a pequeña escala. Los grandes datos son una fuente de una nueva comprensión y la creación de nuevo valor, y una forma de cambiar la relación entre los mercados, las organizaciones, los gobiernos y los ciudadanos". 38-9 Cuando el "People's Daily" lo entrevistó, dijo: "En mi opinión, big data es un valor y una metodología. Lo que enfrentamos no es una muestra aleatoria, sino los datos completos; no es precisión, pero es hibridación; no es causalidad, es correlación. Este es un gran cambio en el pensamiento y es un proceso interactivo: puedes trabajar con big data desde diferentes ángulos y de diferentes maneras, y obtener diferentes resultados "4. El autor cree que big data son datos a gran escala, en los que se pueden adquirir, almacenar, gestionar y analizar rápidamente datos valiosos a través de medios técnicos eficaces, que pueden promover el desarrollo social.
Las cuatro características básicas de big data actualmente se consideran generalmente características de 4V: gran escala (Volumen), amplias fuentes, muchos tipos (Variedad), rápida velocidad de adquisición y procesamiento (Velocidad) y bajo valor. densidad (Valor).
Volumen de datos. Los "datos" en el sentido moderno tienen un alcance más amplio que la información. Al entrar en la era de la información, la connotación de la palabra "datos" comenzó a expandirse: no solo se refiere a "basados en números", sino que también se refiere a toda la información almacenada en las computadoras, incluidos textos, imágenes, videos, etc. Los datos se han convertido gradualmente en un término colectivo para "números, texto, imágenes, vídeos, etc." y son sinónimos de "información". 6256-257
Los datos provienen de una amplia gama de fuentes y tipos (Variedad). En la era de la información, la adquisición de datos no se limita a los cálculos, sino que también incluye los grandes registros, es decir, los datos masivos que las personas suben a Internet a través de teléfonos móviles, ordenadores personales, iPads y otros terminales, así como los datos que los particulares almacenan en teléfonos móviles, ordenadores personales y otros terminales. Los tipos de datos ya no se limitan a datos informáticos sin procesar y datos estructurados, sino que también incluyen datos no estructurados como imágenes, audio y vídeo que las personas graban, guardan y cargan en plataformas de red en su vida diaria.
La velocidad de adquisición y procesamiento de datos. La diversificación de las fuentes de datos hace que los datos sean más abiertos y sociales, lo que hace que la adquisición de datos sea más cómoda, rápida y completa. La tecnología de procesamiento de datos nacida con el desarrollo de big data hace que el procesamiento de datos sea mucho más rápido que en la era de datos tradicional. El procesamiento de datos es cada vez más a gran escala, basado en software e inteligente.
Baja densidad de valor (Value). La densidad de valor es inversamente proporcional a la cantidad total de datos. La densidad de valor de los big data en sí es relativamente baja. Requiere extracción y análisis de datos masivos para obtener información verdaderamente útil y generar valor para el usuario. 5. La información en un determinado campo o contenido específico basada en datos masivos tiene mayor relevancia, información más completa, efectos más obvios y su valor es mayor que el análisis tradicional de pequeños datos. Conclusión: