如何从由制表符和换行符分隔的数据字符串创建dask数据帧

问题描述 投票:0回答:1

我的数据是以字符串形式分隔的\字符(用于列)和新行\ n字符用于行。

ID\Product\quantity\n1\xx\2

看起来Dask.array.from_array()仅支持数组作为输入。

虽然我可以将上面的文本转换为np.array使用

np.array([i.split("\t") for i in data[1].split("\n")])

想知道是否有相当于将字符串直接转换为dask数组或数据帧的东西。

python dask dask-distributed dask-delayed dask-ml
1个回答
0
投票

您可能需要dask.dataframe.read_csv函数

import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')
© www.soinside.com 2019 - 2024. All rights reserved.