这个问题在这里已有答案:
我有一个包含不同类型文件的文件夹。我只需要处理图像文件(jpg,png,jpeg,JPG,...)。为此,我使用glob.glob
只获取带有'jpg','png',...扩展名的文件。
问题是我必须多次使用glob.glob
(与图像扩展名一样多)来获取所有图像:
import glob
images = glob.glob('tests/*.jpg') + glob.glob('tests/*.jpeg') + glob.glob('tests/*.png') + glob.glob('tests/*.JPG')
有没有办法以更优化的形式使用glob.glob
(类似于glob.glob('path/*.{'jpg', 'png', 'jpeg', 'JPG'}
)或者是否有一个更简单的功能来使用它而不是glob
?
你不能像glob.glob('*.{JPG, png..})
那样进行复杂的通配符通配,因为如果你看一下你会看到的源代码,
def glob(pathname):
"""Return a list of paths matching a pathname pattern.
....
"""
return list(iglob(pathname))
然后,如果你找到iglob
的来源,你会看到,
def iglob(pathname):
....
....
dirname, basename = os.path.split(pathname)
# voila, here, our complex glob wildcard will certainly break, and can't be used :)
因此,你只能使用glob
做简单的glob
bing :)
使用pathlib:
from pathlib import Path
extensions = ['.jpg', '.png', '.jpeg']
images = [x for x in Path('tests').iterdir() if x.suffix.lower() in extensions]