与正则表达式指定的范围之间进行选择的文件

问题描述 投票:0回答:2

我有100个文件夹,命名为喜欢的文件夹:

parent_folder/05/01/
parent_folder/05/02/
parent_folder/05/03/
parent_folder/05/04/
...
parent_folder/05/29/
parent_folder/05/30/

我怎么能指定路径,与正则表达式,这将只选择文件夹01 to 10的内容,然后11 to 20,最后21 to 30

我在尝试

"parent_folder/05/[1-10]*/*"

但它也选择11,12,......一直到19。

编辑:我想用10天的时间间隔读取pyspark大型数据集,和所有的参考答案,到目前为止,似乎忽视。

regex pyspark filepath
2个回答
2
投票

如果你想在“10”与你的01 ... 09集,你要使用这样的分组:

parent_folder\/05\/(0[1-9]|10)\/

那么,你的10 ... 20集,

parent_folder\/05\/(1[1-9]|20)\/

等等。

您可以尝试以下的正则表达式与下面的链接:https://regex101.com/r/cXAYbS/2

在Python中,你将需要:

regex = r"parent_folder\/05\/(1[1-9]|20)\/"

上面的链接有一个“蟒”发电机,在那里你可以借用一些代码:

https://regex101.com/r/cXAYbS/2/codegen?language=python


0
投票

这个怎么样:

parent_folder/05/(?:0[1-9]|10)/

在“:”被用于非捕获组。

© www.soinside.com 2019 - 2024. All rights reserved.