dask-distributed 相关问题

Dask.distributed是一个用于Python中的分布式计算的轻量级库。它将concurrent.futures和dask API扩展到中等大小的集群。

延迟延迟错误-AttributeError:'_ thread._local'对象没有属性'value'

我一直在绞尽脑汁想弄清楚为什么我无法在Dask上执行此可并行化的功能。本质上,我有一个在keras模型中加载的函数(我正在使用mlflow存储该模型)...

回答 1 投票 1


导致Dask期货陷入“待定”状态的原因?

我基于dask-docker Dockerfile创建了自己的略微修改的Dockerfile,该Dockerfile安装了adlfs并将我的自定义库之一复制到容器中,以使其对所有人可用...

回答 1 投票 0

Dask多个客户端

是否可能有多个客户端?例如,我是否可以让多个线程同时每个线程运行一个客户端,以便当一个线程阻塞时,其他线程可以继续运行?在这种情况下,...

回答 1 投票 1

Dask如何决定是否重新运行任务

我对Dask并不陌生,他试图构建一个系统来执行具有依赖关系的计算图。但是,有些任务虽然有一个...

回答 1 投票 0

如何最好地将NetCDF文件集合重新打包为Zarr数据集

我正在尝试重新整理NetCDF文件集合并在AWS S3上创建Zarr数据集。我有168个原始的NetCDF4经典文件,它们的维时间数组为:1,y:3840,x:4608,分块成块= {'...

回答 1 投票 6

Dask:设置一个可以连接多台计算机的集群

从文档开始,有一个名为Cluster的类,但是除了LocalCluster以外,我找不到任何有关如何设置一个接受来自不同计算机的工作程序的Cluster的文档(因为这是...

回答 1 投票 0

当我持续使用Dask-ML时超过可用内存时该怎么办

我正在使用Dask-ML运行一些代码,这些代码在训练期间会占用大量RAM内存。训练数据集本身并不大,但是它是在训练期间使用了相当多的RAM内存。我保持...

回答 1 投票 0

Dask如何在云中的多个虚拟机上执行代码

我编写了一个程序,但很快又延迟了,现在我想在云中的多台计算机上运行它。但是有一件事我不理解-冒险如何在...

回答 1 投票 0

Dask-从SQL加载数据帧而不指定index_col

我正在尝试从SQL连接加载Dask数据框。根据read_sql_table文档,有必要传入index_col。如果没有...

回答 1 投票 0

Dask:连续提交,处理所有提交的数据

[具有500个,并且持续增长的DataFrame,我想对(每个DataFrame独立的)数据提交操作。我的主要问题是:可以保留连续提交的数据,...

回答 1 投票 4

dask.submit:调度程序中的内存/负载分配不足

运行一台出色的dask服务器:然后,我开始使用publish_dataset向工作人员中预填充一些数据,并且看起来分配的内存还不错:接下来,我调用futures.append(client.submit(fn,...

回答 1 投票 0

通过Dask向PBS提交自定义工作脚本?

我有一个PBS作业脚本,其中包含一个将结果写入文件的可执行文件。 ###一些行PBS_O_EXEDIR =“ path / to / software” EXECUTABLE =“ executablefile” OUTFILE =“ out” ###复制应用程序目录...

回答 1 投票 0

Dask群集仅在远程dask-workers加入时才会使read_csv失败

我是数据科学/ python的新手,学习速度快,精通贸易,一心一意,我知道这是一个错误,但是可能有解决的办法,我将接受任何野心勃勃的想法。我实例化了一个...

回答 1 投票 0

在本地群集上运行dask时超时OSError

我正在尝试在具有配置的Power PC上运行以下代码:操作系统:Red Hat Enterprise Linux Server 7.6(Maipo)CPE OS名称:cpe:/ o:redhat:enterprise_linux:7.6:GA:server ...

回答 1 投票 0

Dask:从已提交的作业中访问已发布的数据集

#初始化导入时间从dask.pda导入熊猫作为pd导入numpy.distributed import客户端客户端= Client()#发布数据dataset_name ='my_dataset'df_my_dataset = pd.DataFrame(np.ones((2,3)), ...

回答 2 投票 0

VersionMismatchWarning:发现不匹配的版本-blosc

我无法在Windows上执行'pip install blosc'。我在Windows上开发并使用dask-docker在VM上运行我的工作人员和计划。谁有想法?好像dask真的想要所有的linux都...

回答 2 投票 0

使用tls连接的黄昏无法使用to_parquet方法结束程序

我正在使用dask处理10个文件,每个文件的大小约为142MB。我用延迟标签构建了一个方法,下面是一个示例:@ dask.delayed def process_one_file(input_file_path,...

回答 1 投票 0

了解Dask-ML

我已经阅读了Dask-ML文档,并在Google周围搜索,但是有2个问题,我想弄清楚是否有人可以提供帮助:说“使用计算机集群”,是否表示...

回答 1 投票 0

Dask分布式调度程序和大型函数

在带有LocalCluster的Dask分布式调度程序的上下文中:有人可以帮助我了解具有大型(堆)映射功能的动态特性吗?例如,考虑Dask数据框...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.