Databricks文件系统下的文件路径/名称

问题描述 投票:0回答:1

我使用glob函数glob在常规Python下获取目录/文件名。

例如:

glob.glob("/dbfs/mnt/.../*/A*.txt")

但是,在DBFS下刚刚意识到,完整路径名以/ mnt开头。但是在Pyspark下有没有办法像使用glob来获取文件目录/名称列表?

谢谢,

python pyspark pyspark-sql
1个回答
0
投票

如果只想获取目录/名称列表,则只能在Python中完成。Pyspark可以处理目录/名称列表sc.textFile("/dbfs/mnt/.../*/A*.txt"),但不能返回它。

Pyspark是一个处理引擎,而不是文件系统任务的框架。

© www.soinside.com 2019 - 2024. All rights reserved.