我的数据是以字符串形式分隔的\字符(用于列)和新行\ n字符用于行。
ID\Product\quantity\n1\xx\2
看起来Dask.array.from_array()仅支持数组作为输入。
虽然我可以将上面的文本转换为np.array使用
np.array([i.split("\t") for i in data[1].split("\n")])
想知道是否有相当于将字符串直接转换为dask数组或数据帧的东西。
您可能需要dask.dataframe.read_csv函数
import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')