Hay varias formas de crear un RDD Spark
1 Al crear la transformación, también proporciona una gran cantidad. de operaciones, incluyendo map, filter, groupBy, join, etc., RDD usa estas operaciones para generar un nuevo RDD, pero debe tenerse en cuenta que no importa cuántas veces se realice la Transformación, la Acción no puede ejecutarse antes de que el RDD realmente calcule los datos.
2. Acción
La acción es la parte de ejecución de datos, que en realidad ejecuta la parte de cálculo de datos realizando operaciones de conteo, reducción, recopilación y otras. De hecho, todas las operaciones en RDD se ejecutan en modo Lazy. El resultado final no se calcula inmediatamente cuando se ejecuta en la compilación, sino que todos los pasos y métodos de la operación se recuerdan y se muestran solo cuando se encuentra un comando de inicio. La ventaja de esto es que la mayor parte del trabajo inicial se realizó durante la Transformación y, cuando se trabaja en Acción, solo es necesario utilizar todos los grados de libertad para completar el trabajo central del negocio.