¿Qué es el marco distribuido de Python?
Dask es un marco de computación distribuida de Python que admite marcos de datos distribuidos, también conocidos como marcos de datos panda. Las interfaces de los dos son perfectamente compatibles. Sin embargo, Dask es un marco informático distribuido que puede admitir cálculos sobre datos que no se pueden cargar en la memoria. También admite informática distribuida para programas generales de Python. Es un excelente marco de Python. Este artículo presenta principalmente el uso de varios programadores diferentes de Dask.
Dask admite una variedad de programadores, desde un solo subproceso, varios subprocesos y múltiples procesos hasta distribución local y distribución en clúster. Varios programadores tienen diferentes funciones en diferentes situaciones. Este artículo se deriva de la traducción de la documentación oficial de Dask y presenta principalmente los escenarios y métodos de uso de estos cinco programadores. Finalmente, se brindan métodos sobre cómo configurar el programador Dask en diferentes situaciones.