Red de conocimiento informático - Material del sitio web - ¿Cuáles son las fuentes de big data?

¿Cuáles son las fuentes de big data?

Los datos para el análisis de big data provienen de una variedad de fuentes, incluidas fuentes internas y externas dentro de una empresa u organización. Se divide en las siguientes categorías:

1) Datos de transacciones. Esto incluye datos de POS, datos de tarjetas de crédito, datos de comercio electrónico, datos de clics en Internet, datos del sistema de "planificación de recursos empresariales" (ERP), datos del sistema de ventas, datos del sistema de gestión de relaciones con el cliente (CRM), datos de producción de la empresa, datos de inventario. , Datos de pedidos, datos de la cadena de suministro, etc.

2) Datos de comunicaciones móviles. Los dispositivos móviles como los smartphones con acceso a Internet son cada vez más habituales. La cantidad de datos registrados por los dispositivos de comunicación móviles y la integridad tridimensional de los datos suelen ser mejores que los datos que poseen varias empresas de Internet. El software en dispositivos móviles puede rastrear y comunicar innumerables eventos, desde datos transaccionales almacenados usando el software (por ejemplo, eventos de búsqueda de productos registrados) hasta información personal o eventos de informes de estado (por ejemplo, cambios de ubicación que informan un nuevo código geográfico).

3) Datos artificiales. Los datos artificiales incluyen correos electrónicos, documentos, imágenes, audios, vídeos y flujos de datos generados a través de las redes sociales (como WeChat, blogs, Twitter, wikis, Facebook, Linkedin, etc.). La mayoría de estos datos no están estructurados y deben analizarse mediante capacidades de análisis de texto.

4) Datos de la máquina y de los sensores. Datos de sensores, contadores y otras instalaciones, datos de localización/sistema GPS, etc. Esto incluye datos creados o generados por dispositivos funcionales, como controladores de temperatura inteligentes, medidores inteligentes, máquinas de fábrica y electrodomésticos conectados. Los datos emergentes del Internet de las cosas (IoT) son un ejemplo de datos generados por máquinas y sensores. Los datos de IoT se pueden utilizar para construir modelos analíticos, monitorear continuamente el comportamiento predictivo (por ejemplo, identificar cuándo los valores de los sensores indican problemas), proporcionar instrucciones prescritas (por ejemplo, alertar a los técnicos para que revisen el equipo antes de que realmente ocurra un problema) y más.

5) Fuentes de "datos abiertos" en Internet, como datos proporcionados de forma gratuita por agencias gubernamentales, organizaciones sin fines de lucro y empresas.