我有100个文件夹,命名为喜欢的文件夹:
parent_folder/05/01/
parent_folder/05/02/
parent_folder/05/03/
parent_folder/05/04/
...
parent_folder/05/29/
parent_folder/05/30/
我怎么能指定路径,与正则表达式,这将只选择文件夹01 to 10
的内容,然后11 to 20
,最后21 to 30
?
我在尝试
"parent_folder/05/[1-10]*/*"
但它也选择11,12,......一直到19。
编辑:我想用10天的时间间隔读取pyspark大型数据集,和所有的参考答案,到目前为止,似乎忽视。
如果你想在“10”与你的01 ... 09集,你要使用这样的分组:
parent_folder\/05\/(0[1-9]|10)\/
那么,你的10 ... 20集,
parent_folder\/05\/(1[1-9]|20)\/
等等。
您可以尝试以下的正则表达式与下面的链接:https://regex101.com/r/cXAYbS/2
在Python中,你将需要:
regex = r"parent_folder\/05\/(1[1-9]|20)\/"
上面的链接有一个“蟒”发电机,在那里你可以借用一些代码:
这个怎么样:
parent_folder/05/(?:0[1-9]|10)/
在“:”被用于非捕获组。