Red de conocimiento informático - Aprendizaje de código fuente - El valor de la suma de datos es mucho mayor que la suma de los valores de los datos

El valor de la suma de datos es mucho mayor que la suma de los valores de los datos

El valor de la suma de datos es mucho mayor que la suma de los valores de los datos

Con la aparición de la banda ancha, Internet móvil, Internet de las Cosas, redes sociales, Y la computación en la nube, ha surgido una era de big data, que llegó de forma natural e inadvertida. No hace mucho, el Parque Industrial Fengxi Big Data se instaló silenciosamente en el nuevo distrito de Xixian, provincia de Shaanxi, y está "probando el terreno" en el desarrollo de la industria de big data.

La cantidad total de datos globales se duplica cada dos años

El Sr. He, que se dedica a la industria publicitaria, cultural y creativa, recuerda claramente que los únicos datos que compró 12 Hace años, las computadoras domésticas con una capacidad de disco duro de 20 GB cambiaron rápidamente a espacios de almacenamiento host de 80 GB, 120 GB, 250 GB y 500 GB que se han ampliado continuamente para satisfacer las necesidades de uso. "Hoy en día, los discos duros de 2 TB no son suficientes y tenemos que depender de dispositivos de almacenamiento móviles para realizar copias de seguridad".

Según las estadísticas de seguimiento de IDC (International Data Corporation), la cantidad total de datos globales en 2011 ha alcanzado 1,8 ZB (1 ZB equivale a 1 billón de GB, 1,8 ZB equivale a 1,8 mil millones de discos duros móviles de 1 TB), y este valor aún se duplica cada dos años. Se espera que para 2020, el mundo tenga un total de 35 ZB. volumen de datos, un aumento de casi 20 veces.

Debido a la rápida expansión de la escala de datos, la cantidad de datos acumulados en diversas industrias es cada vez mayor y los tipos de datos se vuelven cada vez más complejos, lo que ha superado las capacidades de la gestión de datos tradicional. sistemas y modelos de procesamiento, por lo que surgió un concepto como "grandes datos" que se acerca al "infinito" en significado.

"La primera es que es de gran tamaño y es un concepto de un conjunto completo de datos". Chen Wei, director del Departamento de Industria de Servicios de Software del Ministerio de Industria y Tecnología de la Información, resumió cuatro. "La segunda es que hay muchos tipos, incluida la estructura. Hay varios tipos de datos, como datos estructurados, datos semiestructurados, datos no estructurados, etc., entre los cuales los datos de video representan actualmente más de 90. % del total; el tercer requisito es velocidad rápida y procesamiento dinámico en tiempo real en el segundo nivel "

"Lo último es la densidad de valor". coexisten datos potencialmente inútiles, "hay oro y arena en todas partes", por lo que el propósito de big data es extraer datos de enormes colecciones de datos, encontrar datos y conocimientos valiosos y proporcionar sabiduría real a diversas industrias a través del análisis y la minería. Se puede decir que el siglo XXI es la era de los 'datos que extraen petróleo'."

"Tomemos los datos interactivos como ejemplo. En la actualidad, algunas plataformas de medios propios, como Sina Weibo, tienen más que eso. "Se publican 25 millones de mensajes de Weibo cada día y hay mucha información valiosa que aún no se ha descubierto", afirmó Li Jun, ingeniero jefe adjunto del Instituto de Investigación para el Desarrollo de la Industria de la Información Electrónica de China. Detrás de una cantidad tan enorme de datos no estructurados, cómo utilizar la tecnología de big data para descubrir tendencias y información prospectiva a partir de la acumulación masiva de datos interactivos puede descubrir y generar un enorme valor social y comercial.

El big data detrás de una pequeña manzana: el valor de la suma de datos es mucho mayor que la suma de los datos

“Debido a que los métodos de operación empresarial de almacenamiento, análisis, Las aplicaciones, etc. aún no tienen una forma final, y el potencial de desarrollo y el espacio de innovación de esta industria son muy grandes". Liu Yubin, subdirector del Comité de Gestión del Nuevo Distrito de Xixian de la provincia de Shaanxi y director de Fengxi New Town Management Comité, hizo una simple analogía de "grandes datos detrás de la pequeña manzana":

Tomando como ejemplo el desarrollo de la industria de la manzana en la provincia de Shaanxi, los datos de información geográfica espacial necesarios para determinar dónde se encuentra una determinada variedad de manzanas son más adecuados para el crecimiento se superpone con datos como el rendimiento de las manzanas y el contenido de azúcar en el área de producción específica, y a través del Internet de las cosas y otros medios dan a las manzanas una "identidad" única y rastreable, que puede monitorearse en tiempo real durante el proceso. Proceso de plantación. Los datos recopilados a partir de la "retroalimentación" de cada manzana, si son lo suficientemente masivos, se pueden integrar en big data.

Con estos datos, primero se puede generar valor con los clientes potenciales a través de servicios de alquiler y venta de datos. “Este tipo de modelo de negocio refleja que el valor de la suma de los datos es mucho mayor que la suma de los valores. de los datos.

En segundo lugar, si se pueden utilizar métodos científicos como el análisis grupal y la minería de datos, complementados con computación en la nube, almacenamiento distribuido y otros medios, se pueden realizar análisis en profundidad y servicios de predicción de los datos. "¿Qué manzanas son de alta calidad? Lo mejor, la respuesta del mercado será mejor, ¿cuál será la producción y las ventas el próximo año y cómo cambiará la preferencia por las compras de manzanas en varios mercados?" Este tipo de minería de datos y la predicción El análisis del comportamiento del consumidor detrás de esto alguna vez fue prerrogativa de los estadísticos. En el futuro, puede tomar unos minutos completarlo.

Una vez que los datos se acumulan y se comparan con otros lugares en todo el país, se pueden proporcionar. servicios de apoyo a la toma de decisiones para el desarrollo de la industria de la manzana en Shaanxi y sirva como guía para el gobierno y la industria como base para la toma de decisiones de producción para evitar productos invendibles y daños a los intereses de los productores de frutas.

Finalmente. Con el establecimiento de la autoridad de los datos y los métodos de análisis, es posible que los proveedores de servicios de datos creen una plataforma de análisis de big data de terceros para proporcionar mejor información. Muchos titulares de datos brindan servicios de clasificación, filtrado, análisis y procesamiento de datos. Es posible que algún día se desarrollen plataformas comerciales de intercambio de datos de terceros similares a las plataformas comerciales de comercio electrónico como eBay y Taobao.