同时计算多个任务并同时执行多个任务Dask

问题描述 投票:0回答:1

我有2个工作人员(AB),df,并且我正在尝试通过以下任务来计算多个描述性统计信息:

Task 1: df.isnull().sum()
Task 2: df['column'].value_counts()

我想将task1分配给A,将task2分配给B以使计算与dask并行。

从文档中,如何实现此目标尚不清楚。我有以下代码:

future = client.compute(task1, task2, workers={task1: 'ipofA',task2: 'ipofB' })
future.result()

但是这给了我以下错误:

ValueError: The truth value of a Series is ambiguous. Use a.any() or a.all().

第二个问题是如何将task1分配给计算机A和B,将task2分配给计算机C?

python dataframe dask dask-distributed
1个回答
0
投票

以下代码应该起作用:

x = df.isnull().sum()
y = df['column'].value_counts()
x, y = dask.compute(x, y)

第二个问题是如何将任务1分配给计算机A和B,将任务2分配给计算机C?

您不应该。您应该让Dask做出最好的决定。

© www.soinside.com 2019 - 2024. All rights reserved.