我有一个主文件夹,每天都会在其中放置一个新的子文件夹。在这些子文件夹中,有多个 CSV 文件。在这些多个 CSV 文件中,我需要根据预定义的日期间隔连接每个子文件夹中的一个特定文件。
子文件夹始终命名为日期(等“20230227”),文件始终命名为“Some_File-/*.csv”
我假设答案是这样的:
import pandas as pd
import glob
from pathlib import Path
Start_date = '20230101'
End_date = '20230227'
directory = "\Main-Folder-Path\subfolders....."
#Read CSV file
df_temp = []
for sub_folder in #all subfolders in the above date range:
for file in Path(directory).glob("Some_File-/*.csv"):
df_temp.append(pd.read_csv(file))
#concatenate into a single data frame
df = pd.concat(df_temp)