¿Cómo obtener información y rastrear la fuente de datos anormales?
Métodos basados en marcadores y métodos basados en funciones inversas.
El método basado en anotaciones, aunque es fácil de implementar, requiere espacio de almacenamiento adicional y la eficiencia de ejecución disminuirá a medida que aumenta la cantidad de datos procesados, lo que dificulta su aplicación directa a los datos de Hive que mantiene cantidades masivas de datos.
El método basado en la función de inversión requiere menos espacio de almacenamiento, pero no todo el procesamiento de datos se puede invertir y su rendimiento de trazabilidad depende completamente del mecanismo de inversión.