¿Cuál es la biblioteca informática basada en lotes en flink?
Como marco de procesamiento de datos distribuido, Flink proporciona interfaces que admiten cálculos y cálculos por lotes, abstrayendo bibliotecas de componentes para diferentes tipos de aplicaciones, como CEP (Biblioteca de procesamiento de eventos complejos) basada en procesamiento de flujo, SQL amp; biblioteca, FlinkML (biblioteca de aprendizaje automático) basada en lotes, Gelly (biblioteca de procesamiento de gráficos), etc.
La capa API incluye la API DataStream para construir aplicaciones informáticas de flujo y la API DataSet para aplicaciones informáticas por lotes. Ambas proporcionan a los usuarios API avanzadas de procesamiento de datos enriquecidas, como operaciones Map y FlatMap, y también proporcionan una. API de función de proceso de nivel relativamente bajo, y los usuarios pueden operar directamente datos subyacentes como el estado y el tiempo.
Flink
Flink implementa un marco informático de flujo en tiempo real de alto rendimiento, baja latencia y alto rendimiento mediante la implementación del modelo informático de flujo de datos de Google. Al mismo tiempo, Flink admite una gestión de estado altamente tolerante a fallas para evitar la pérdida de estado debido a anomalías del sistema durante el proceso de cálculo. Flink implementa periódicamente un mantenimiento de estado persistente a través de puntos de control de tecnología de instantáneas distribuidas, de modo que se puedan calcular los resultados correctos incluso en caso de tiempo de inactividad o anomalía del sistema.