我正在使用stable / dask存储库中的Helm Chart与Kasknetes上的Dask一起工作。当使用分布式客户端,并调用client.scatter(ddf)时,我得到了一个Exception,如下所示:
例外:没有名为'pandas.core.internals.managers'的模块; 'pandas.core.internals'不是一个包
查看已安装的软件包,在Python 3.7上显示Pandas == 0.24.1&dask-core == 1.1.1。
查看工作人员的内存消耗情况表明没有任何内容发送给工作人员,当我添加关键字='broadcast'时,我可以观察到第二个工作人员的内存使用量短期上升,但后来我得到了上面引用的错误。
对于我做错了什么的建议,还是Dask / Pandas的问题?
谢谢。
我的猜测是你在不同机器上的Pandas版本有所不同。您可以使用以下命令进行检查。
client.get_versions(check=True)