¿Qué significa la era del big data? ¿En qué contexto se propuso el big data?
Era del big data:
La primera persona que propuso la llegada de la era del big data fue la consultora de renombre mundial McKinsey. El big data ha sido ampliamente utilizado en campos como la física. , biología, ecología ambiental y militar. Industrias como las finanzas y las comunicaciones existen desde hace mucho tiempo, pero han atraído la atención de la gente solo debido al desarrollo de Internet y las industrias de la información en los últimos años.
Los antecedentes del big data:
En 2012, el término big data se mencionó cada vez más y se utilizó para describir y definir los datos masivos generados en la era de la información. explosión, y nombre los desarrollos tecnológicos y las innovaciones asociadas con ella.
Apareció en la portada de la columna del *** Wall Street Journal, entró en el sitio web oficial de noticias de la Casa Blanca, apareció en algunas conferencias y salones nacionales con temas de Internet e incluso fue recogido por la Corporación Financiera Nacional con un agudo olfato Securities, Guotai Junan, Galaxy Securities, etc. han escrito informes de asesoramiento sobre inversiones.
Los datos se están expandiendo rápidamente y determinan el desarrollo futuro de las empresas. Aunque es posible que muchas empresas aún no sean conscientes de los peligros ocultos causados por el crecimiento explosivo de los datos, a medida que pase el tiempo, la gente será cada vez más consciente de la importancia de los datos para las empresas.
Como decía una columna de febrero de 2012 en la revista "***", la era del "big data" ha llegado, y en los negocios, la economía y otros campos, las decisiones se basarán cada vez más en datos y análisis en lugar de que la experiencia y la intuición.
Gary King, profesor de sociología en la Universidad de Harvard, dijo: "Esto es una revolución. La gran cantidad de recursos de datos hace posible iniciar el proceso cuantitativo en todos los campos, ya sea académico, empresarial o * ***, esto es cierto en todos los campos. "
Ampliando la cantidad de información
El impacto del big data
La sociedad actual es una sociedad en rápido desarrollo. La sociedad, con la tecnología, con el desarrollo, la circulación de la información y la comunicación entre las personas se están acercando cada vez más, y la vida se vuelve cada vez más conveniente. Los grandes datos son el producto de esta era de alta tecnología.
Con la llegada de la era de la nube, el big data ha atraído cada vez más atención.
Big data se utiliza a menudo para describir las grandes cantidades de datos no estructurados y semiestructurados creados por una empresa. Si estos datos se descargan en una base de datos relacional para su análisis, consumirán mucho tiempo y dinero. .
El análisis de big data a menudo se asocia con la computación en la nube porque el análisis en tiempo real de grandes conjuntos de datos requiere el uso de marcos como MapReduce para distribuir el trabajo entre decenas, cientos o incluso miles de computadoras.
?
En la sociedad actual, la aplicación del big data está destacando cada vez más sus ventajas, ocupando cada vez más campos, como el comercio electrónico, el O2O, la logística y la distribución. Etc. Etc., varios campos que utilizan big data para el desarrollo están ayudando a las empresas a desarrollar continuamente nuevos negocios e innovar modelos operativos.
Con el concepto de big data, el juicio sobre el comportamiento del consumidor, la predicción de las ventas de productos, la precisión del alcance del marketing y la precisión del reabastecimiento del inventario se han mejorado y optimizado de manera integral.
Los "grandes datos" en la industria de Internet se refieren al fenómeno de que las empresas de Internet generan y acumulan datos sobre el comportamiento de la red de los usuarios en las operaciones diarias.
Estos datos son demasiado grandes para medirlos en Gs o Ts.
¿Qué tamaño tiene el big data? Un conjunto de datos denominado “Un día en Internet” nos dice que en un día, todo el contenido generado por Internet puede llenar 168 millones de DVD y se enviaron 294 mil millones de correos electrónicos (equivalente a dos años de producción de papel en Estados Unidos); . correo).
Publicó 2 millones de publicaciones comunitarias (equivalente a 770 años de texto de la revista "Time"); vendió 378.000 teléfonos móviles, lo que supone más de los 371.000 bebés que nacen cada día en el mundo....
A partir de 2012, la cantidad de datos ha saltado del nivel de TB (1024GB=1TB) al nivel de PB (1024TB=1PB)
Nivel de Exabyte (1024PB=1EB) o incluso ZB nivel (1024EB =1ZB).
Los resultados de una investigación de la Corporación Internacional de Datos (IDC) muestran que la cantidad de datos generados globalmente en 2008 fue de 0,49 ZB, en 2009 fue de 0,8 ZB, en 2010 aumentó a 1,2 ZB y en 2011 llegó a 1.82ZB, lo que equivale a La cantidad promedio de datos por persona en el mundo supera los 200 GB.
A partir de 2012, el volumen de datos de todos los materiales impresos producidos por humanos es de 200 PB, y el volumen de datos de todas las palabras pronunciadas por todos los humanos a lo largo de la historia es de aproximadamente 5 EB.
La investigación de IBM muestra que el 90% de todos los datos adquiridos por la civilización humana se han generado en los últimos dos años.
En 2020, la cantidad de datos generados a nivel global será 44 veces mayor que la actual.
?
Cada día se suben más de 500 millones de imágenes en todo el mundo y cada minuto se comparten 20 horas de vídeo.
Sin embargo, ni siquiera toda la información que la gente crea todos los días (todas las comunicaciones, incluidas las llamadas de voz, los correos electrónicos y los mensajes, así como todas las imágenes, vídeos y música subidos) puede igualar la cantidad de información digital.
Esta tendencia continuará.
Aún estamos en las primeras etapas de lo que se conoce como "Internet de las cosas" y, a medida que la tecnología madure, nuestros dispositivos, vehículos y la tecnología "portátil" en rápida evolución podrán conectarse y comunicarse. unos con otros.
Los avances en tecnología han reducido el coste de creación, captura y gestión de información a una sexta parte de lo que era en 2005, mientras que la inversión empresarial en hardware, software, talento y servicios ha crecido desde 2005 Un total de 50 hace años, alcanzando los 400 mil millones de dólares.
?
La esencia del big data
El big data nos ha traído tres cambios conceptuales disruptivos: Son todos datos, no muestras aleatorias. Es algo general; dirección, no una guía precisa; es una correlación, no una relación causal.
R. No muestras aleatorias, sino todos los datos: en la era del big data, podemos analizar más datos y, a veces, incluso procesar todos los datos relacionados con un determinado fenómeno, en lugar de depender del muestreo (. muestreo aleatorio, solíamos darlo por sentado, pero la tecnología digital de alto rendimiento nos hace darnos cuenta de que esto es en realidad una limitación artificial
B. No es exacto, pero sí mixto: hay hay demasiados datos de investigación y ya no nos interesa la precisión; en el pasado, había muy pocos datos que pudieran analizarse, por lo que tuvimos que cuantificar los registros con la mayor precisión posible, y la obsesión por la precisión aumentará gradualmente. se debilita a medida que aumenta la cantidad de datos; con big data, ya no necesitamos llegar al fondo de un fenómeno, siempre que obtengamos la dirección general.
Ignorar adecuadamente la precisión a nivel micro nos dará mejores conocimientos a nivel macro.
C. No causalidad, sino correlación: ya no estamos interesados en buscar relaciones causales; hábito de larga data de los seres humanos. En la era del big data, ya no necesitamos prestar atención a la causa y el efecto de las cosas, debemos buscar la correlación entre las cosas, la correlación puede no ser precisa; Es posible que la correlación no nos diga exactamente por qué sucedió algo, pero nos recordará que está sucediendo.