从git仓库导入多个csv文件到熊猫

问题描述 投票:-3回答:1

嗨,我正在尝试在Dataframe中导入许多csv文件。我有一个错误:值错误:没有要串联的对象

这是我的代码:

from glob import iglob
import numpy as np
import pandas as pd
# read datas from github repository
path = r'https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_daily_reports'
df1 = pd.concat((pd.read_csv(f) for f in iglob(path+"/*.csv", recursive=True)), ignore_index=True)

感谢您的帮助。如果认为是由于路径定义引起的?

python pandas git csv glob
1个回答
0
投票

错误表明dfs为空,因此行pd.concat(dfs,...)失败。因此,我猜测.csv文件不在预期的位置。

如果您有奇怪的数据文件夹结构,它应该可以加载,但是由于我看不到您的文件夹结构,因此我很难知道。

尝试此构造:

path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename))

df1 = pd.concat(dfs, recursive=True)), ignore_index=True)
© www.soinside.com 2019 - 2024. All rights reserved.