从github文件夹导入多个csv文件-Python-COVID-19

问题描述 投票:0回答:3

我想在这里做两件事:

  1. 导入所有.csv文件,并将它们添加到df中。
  2. 用最新上传的文件更新df。

我已经能够使用以下命令导入一个.csv:

import pandas as pd
url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_daily_reports/01-22-2020.csv' 
pd.read_csv(url).fillna(0)

我可以一次导入所有.csv文件(如果我知道如何提取所有.csv文件名,则可以循环执行),但是应该有一种更有效的方法。一旦有了df,就可以“更新”它:

  1. 提取所有.csv文件名。
  2. 检查它们是否都在df中(带有日期列)。如果缺少一个,请将丢失的.csv文件添加到df。

我遇到的问题是:(a)如何使可伸缩方式提取所有.csv文件? (b)有什么方法可以从github文件夹中仅提取以.csv结尾的文件名?为了执行上述第(2)项。

python pandas csv
3个回答
0
投票
拥有所有csv文件路径后,现在可以将其循环并读取为df,检查是否缺少列或任何其他种类

0
投票
但是我相信细节已经得到答复。 over here

0
投票
© www.soinside.com 2019 - 2024. All rights reserved.