并非所有版本的
dask.dataframe
和 pandas
都兼容。这已经在这个问题中得到解决
我尝试了几种组合,但与最近的 dask 版本结合使用时,我得到了
dask.dataframe
的工作(例如 dask 2023.2.0
和 pandas 2.1.2
中的 Python 3.10.12
),我在导入客户端时遇到了问题:
from distributed import Client
File "/mypath/progs/myprog.py", line 16, in <module>
from distributed import Client
File "/usr/lib/python3/dist-packages/distributed/__init__.py", line 23, in <module>
from .deploy import Adaptive, LocalCluster, SpecCluster, SSHCluster
File "/usr/lib/python3/dist-packages/distributed/deploy/__init__.py", line 5, in <module>
from .local import LocalCluster
File "/usr/lib/python3/dist-packages/distributed/deploy/local.py", line 15, in <module>
from .utils import nprocesses_nthreads
File "/usr/lib/python3/dist-packages/distributed/deploy/utils.py", line 4, in <module>
from dask.utils import factors
ImportError: cannot import name 'factors' from 'dask.utils' (/mypath/.local/lib/python3.10/site-packages/dask/utils.py)
我真的不认为这仍然与熊猫有关,但谁知道......
有人知道这里发生了什么以及如何导入 dask.dataframe 和客户端吗?
如果可能,将
distributed
更新到与dask
相同的版本(它们几乎同时发布)。