为什么dask显示的大小比数据(numpy数组)的实际大小小?

问题描述 投票:0回答:1

Dask
显示的大小比 numpy 数组的实际大小稍小。以下是
numpy
数组的示例,大小正好为 32 Mb:

import dask as da
import dask.array
import numpy as np

shape = (1000,4000)
ones_np = np.ones(shape)
print(f"Size:{ones_np.nbytes / 1e6} Mb")
>> Size: 32.0 Mb

但是 Dask 显示为 30.52:

ones_da = da.array.ones(shape)
ones_da

如果我这样做

ones_da.nbytes/1e6
它会返回正确的(32 Mb)大小。

我认为 dask 数组大小应该显示实际大小?

python numpy dask dask-distributed
1个回答
0
投票

负责的函数是here,它只支持 2 的幂,而不是 10。这与下面的时间单位形成对比。您可以要求这是一个可配置的东西,但有人必须做一些工作。

© www.soinside.com 2019 - 2024. All rights reserved.