在Dask.distributed中使用client.scatter(df)时引发异常

问题描述 投票:0回答:1

我正在使用stable / dask存储库中的Helm Chart与Kasknetes上的Dask一起工作。当使用分布式客户端,并调用client.scatter(ddf)时,我得到了一个Exception,如下所示:

例外:没有名为'pandas.core.internals.managers'的模块; 'pandas.core.internals'不是一个包

查看已安装的软件包,在Python 3.7上显示Pandas == 0.24.1&dask-core == 1.1.1。

查看工作人员的内存消耗情况表明没有任何内容发送给工作人员,当我添加关键字='broadcast'时,我可以观察到第二个工作人员的内存使用量短期上升,但后来我得到了上面引用的错误。

对于我做错了什么的建议,还是Dask / Pandas的问题?

谢谢。

dask dask-distributed
1个回答
0
投票

我的猜测是你在不同机器上的Pandas版本有所不同。您可以使用以下命令进行检查。

client.get_versions(check=True)
© www.soinside.com 2019 - 2024. All rights reserved.