Dask
显示的大小比 numpy 数组的实际大小稍小。以下是 numpy
数组的示例,大小正好为 32 Mb:
import dask as da
import dask.array
import numpy as np
shape = (1000,4000)
ones_np = np.ones(shape)
print(f"Size:{ones_np.nbytes / 1e6} Mb")
>> Size: 32.0 Mb
但是 Dask 显示为 30.52:
ones_da = da.array.ones(shape)
ones_da
如果我这样做
ones_da.nbytes/1e6
它会返回正确的(32 Mb)大小。
我认为 dask 数组大小应该显示实际大小?
负责的函数是here,它只支持 2 的幂,而不是 10。这与下面的时间单位形成对比。您可以要求这是一个可配置的东西,但有人必须做一些工作。