自动搜索文件夹以获取特定的excel文件并导入到熊猫中

问题描述 投票:1回答:1

到目前为止,我还没有看到我要问的问题。

我在说C盘的文件夹中有2个excel文件,它们的名称为说RedRose。文件的开头是日期09-30-2019_rest_of_name1,... name2。_rest_of_name1,... name2是静态的,每天都会更新日期,因为每天都会将新文件添加到RedRose文件夹中。

使用“运行时使用Python”命令,我要自动查找该文件夹,搜索每个文件名,并将每个文件导入其自己的pandas数据框。

想法,这可以用Python完成吗?

不确定从哪里开始

python excel pandas import directory
1个回答
0
投票

您可以使用glob模块获得当前目录中的文件列表。

import glob
files = glob.glob('C:\RedRose\*.xls*')

它将返回扩展名为.xls的文件列表,并使用正则表达式检查正确的名称。另外,Windows路径格式可能有所不同

使用Pandas库中的read_excel函数将Excel文件读入DataFrames。您可以循环浏览files中的所有文件名,并将每个DataFrame存储为列表或字典的元素。

import pandas as pd

dataframes = []
for filename in files:
    dataframes.append(pd.read_excel(filename))

为了读入字典,您需要为每个DataFrame指定一个键。我建议使用文件名作为密钥,因为它是唯一的。

© www.soinside.com 2019 - 2024. All rights reserved.