dask-distributed 相关问题

Dask.distributed是一个用于Python中的分布式计算的轻量级库。它将concurrent.futures和dask API扩展到中等大小的集群。

如果功能不在模块级别,如何将功能提交给Dask?

我在dask分布式系统中有稀疏矩阵。我想将其转换为数组并留在分布式系统中。我可以在本地计算机上这样操作:from scipy.sparse import ...

回答 1 投票 0


对未来结果的管理不善会降低业绩表现

我正在寻找有关如何解决下述瓶颈的任何建议。在轻松的分布式基础架构中,我会绘制一些期货图,并在准备就绪时获得结果。一旦检索到,我就...'

回答 1 投票 0

以编程方式启动远程工作者

我需要以编程方式创建远程工作者,并将其用于任务,然后将其关闭。文档中给出的示例代码可以很好地完成以下工作:从分布式系统导入asyncio ...

回答 1 投票 0

清理Dask工作者的内存

我正在多节点分布式Dask群集上运行多个并行任务。但是,一旦任务完成,工作人员仍然拥有大量内存,并且群集很快就会被填满。我已经尝试过...

回答 1 投票 0

高效使用带有dask分布式和gensim的多个内核

我有一个无法容纳到内存中的巨大数据框。因此,我可以通过dask(分布式)在Python中访问它。我想使用gensim包基于一个...的条目来训练Word2Vec / Doc2Vec模型...

回答 1 投票 0

如何从Dask调度程序获取仪表板地址

启动启动分布式分布式本地集群时,可以为dashboard_address设置随机端口或地址。如果以后再获取调度程序对象。有没有一种方法可以提取...

回答 1 投票 0

在Kubernetes上部署自适应多用户Dask集群

在Kubernetes上部署自适应多用户Dask集群的正确方法是什么?我需要一个可以供多人使用的集中式计算机集群,以便可以添加更多计算机...

回答 1 投票 0

Dask在单核上的缓慢计算性能

我实现了一个map函数,该函数将字符串解析为XML树,遍历该树并提取一些信息。大量的if-then-else东西,没有其他的IO代码。我们从...

回答 1 投票 0

如果延迟计算,如何检查dask数据帧是否为空?

我知道这个问题。但是,请检查以下代码(最小工作示例):将dask.dataframe导入为dd,将pandas导入为pd#初始化列表数据。数据= {'名称':['汤姆','尼克','krish','...

回答 1 投票 1


Dask client.persist尝试使用HashingVectorizer时返回AssertionError

我正在尝试使用dask HashingVectorizer对dask.dataframe进行矢量化处理。我希望向量化结果保留在群集(分布式系统)中。这就是为什么我尝试使用client.persist的原因...

回答 1 投票 0

当Dask任务运行多次时,使用哪个结果?

首先,请阅读此问题:使用分布式Dask调度程序重复执行任务现在,当Dask由于工作人员窃取或任务失败(由于内存限制而决定重新运行任务时,由于内存限制...

回答 1 投票 0

每列的dask groupby分别给出错误的结果

我在这里用虚拟数据模拟我实际想要做的事情。我需要执行的步骤:分别对每列进行一些转换。执行分组操作以汇总...

回答 2 投票 1

使用C指针时,Das VS多处理

[当我在python中使用C指针并尝试使用dask处理它时,它像专业人士一样工作。但是,当我尝试使用python的多处理模块时,它将拆分指针引用错误。怎样才能做到...

回答 1 投票 0

dask。分布式未利用群集

我无法使用分布式集群来处理此块。从dask导入熊猫作为pd从dd导入数据帧作为d导入daf df = pd.DataFrame({'reid_encod':[[1,2,3,4,5,6,7,8,9,10],[1,2 ,3,4,...

回答 2 投票 0

为什么Dask使用from_pandas比直接使用dask读取数据帧更快?

i以不同的方式在dask中运行相同的数据集。我发现一种方法几乎比另一种方法快十倍!!!我试图找到没有成功的原因。 1.完全用dask导入dask ....

回答 1 投票 0

Das aysncio tornado TimeoutError

我正在按计划在YARN群集上运行Dask-YARN作业。作业将创建“延迟的Dask”任务列表,并使用以下代码将其提交到集群:from dask_yarn import YarnCluster ...

回答 1 投票 0

在提交所有任务之前如何阻止任务执行?

我正在建立一个框架,在该框架中,使用Submit将每个任务都提交给用户提供的dask客户端,例如:future = client.submit(my_func,* args)某些函数对...有多个依赖关系]]

回答 1 投票 0

Numpy种子有时不适用于dask功能

在运行分布式分布式函数调用时,播种有时会失败。希望将种子值传递给大多数时间都有效的一组MC模拟试验。但不总是。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.