快速执行被卡在LocalCluster中

问题描述 投票:0回答:1

我正在使用具有EC216 cores64GB ram VM。编写了一个Dask程序,该程序在数据帧上应用过滤器,并对另一个过滤器执行concat,然后将数据写回到磁盘。如果我通过简单地调用LocalClusterclient = Client()模式下运行它,则在写入一些数据后,执行会停滞在某个位置。在此期间,CPU利用率非常低,我可以很容易地理解到什么都没有执行。此时零件文件的大小也停止增加。这将永远持续下去。但是,如果我在不创建LocalCluster的情况下执行它,它将运行非常慢(CPU利用率较低)并完成程序。试图了解如何解决此问题。

注意:没有其他人正在使用VM,数据大小范围从3GB到25GB。

Dask版本:2.15.0和2.17.2

python dask dask-distributed
1个回答
0
投票

很遗憾,您的问题中没有足够的信息来提供有用的答案。有很多事情可能会发生。

© www.soinside.com 2019 - 2024. All rights reserved.