¿Cuáles son las características del big data de IoT?
1. Distribución eficiente
Debe ser un sistema distribuido eficiente. La cantidad de datos generados por el Internet de las cosas es enorme. Sólo en China, hay más de 500 millones de medidores inteligentes que recopilan datos cada 15 minutos en todo el país y generan más de 50 mil millones de registros al día. Ningún servidor es capaz de procesar una cantidad tan grande de datos, por lo que el sistema de procesamiento debe ser distribuido y escalable horizontalmente. Para reducir costos, el rendimiento del procesamiento de un nodo debe ser eficiente y admitir una escritura y consulta rápidas de datos.
2. Procesamiento en tiempo real
Debe ser un sistema de procesamiento en tiempo real. Los escenarios familiares para el procesamiento de big data en Internet son retratos de usuarios, sistemas de recomendación, análisis de opinión pública, etc. Estos escenarios no requieren rendimiento en tiempo real y pueden procesarse en lotes. Sin embargo, para los escenarios de IoT, es necesario tomar decisiones y advertencias en tiempo real basadas en los datos recopilados, y el retraso debe controlarse en segundos. Si la informática no es en tiempo real, el valor comercial del Internet de las cosas se reducirá considerablemente.
3. Alta confiabilidad
Requiere servicios de alta confiabilidad a nivel de operador. El sistema de Internet de las cosas a menudo está conectado al sistema de producción y operación. Si el sistema de procesamiento de datos falla, provocará directamente el cierre de la producción, lo que provocará pérdidas económicas y la incapacidad de brindar servicios normales a los consumidores finales. Por ejemplo, si hay un problema con el sistema de contador inteligente, provocará directamente que miles de hogares no puedan utilizar la electricidad con normalidad. Por lo tanto, el sistema de big data de IoT debe ser altamente confiable, debe admitir copias de seguridad de datos en tiempo real, debe admitir la recuperación de desastres fuera del sitio, debe admitir actualizaciones en línea de software y hardware y debe admitir la migración en línea de la sala de computadoras IDC; de lo contrario, los servicios deben ser interrumpido.
4. Almacenamiento en caché eficiente
Requiere una función de almacenamiento en caché eficiente. En la mayoría de los escenarios, es necesario obtener rápidamente el estado actual del dispositivo u otra información para alarmas, visualización en pantalla grande u otros fines. El sistema debe proporcionar un mecanismo eficiente para que los usuarios puedan obtener el estado más reciente de todos o algunos dispositivos que cumplan con las condiciones de filtrado.
5. Computación de transmisión en tiempo real
Se requiere computación de transmisión en tiempo real. Varias advertencias o predicciones en tiempo real ya no se basan simplemente en un umbral determinado, sino que requieren la agregación y el cálculo en tiempo real de flujos de datos generados por uno o más dispositivos, no solo en función de un momento determinado, sino en función de una ventana de tiempo. . No solo eso, los requisitos de cálculo también son bastante complejos y varían según el escenario, por lo que se deben permitir funciones definidas por el usuario para el cálculo.
6. Suscripción de datos
Necesidad de admitir la suscripción de datos. En consonancia con una plataforma general de big data, muchas aplicaciones suelen requerir el mismo conjunto de datos, por lo que el sistema debe proporcionar una función de suscripción y alertar a las aplicaciones en tiempo real cada vez que se actualizan nuevos datos. Además, esta suscripción también debe ser personalizada, permitiendo a la aplicación establecer condiciones de filtrado, como suscribirse únicamente al promedio de cinco minutos de una determinada cantidad física.