在python中使用硒从基于Ambari(HDFS)的文件名下载文件

问题描述 投票:0回答:1

我希望能够在Ambari文件查看器中的指定路径中下载具有特定文件名的所有csv文件。

即在Google chrome上打开ambari文件查看器,使用用户名和密码登录ambari文件查看器,导航到ambari中的指定文件夹,使用通配符(例如file _ _ 20191231。csv)根据文件名下载所有相关的csv文件,并放置指定的Windows文件夹中的文件]

python python-3.x selenium file ambari
1个回答
0
投票

似乎非常可行,我不确定您的问题是什么,并且我对Ambari并不熟悉。为了处理这样的项目,我建议执行以下步骤:

[第1步:研究Selenium,并进行诸如登录社交媒体或其他Web帐户的操作。

[步骤2:专门查看用于通过ID,类和xpath标识项目的部分。检查Ambari的html,查看ID或类对于您需要与之交互的元素(例如,用户名和密码字段)是否似乎可靠。如果需要,请使用xpath。

[第3步:找到文件所在的列/容器,并创建一个循环以将文本拉出每个容器。如果需要,添加页面分页。

步骤4:使用python阅读每个文本,如果其中包含所需的子字符串,请让selenium右键单击刚访问的元素并下载(或单击相应的下载按钮(如果可用)。

第5步:使用os将文件从下载文件夹移至计算机上所需的文件夹,然后关闭另一个线程进行此操作here

P.S。您需要一个兼容的chromedriver.exe来运行带有chrome的硒。再次,查看selenium docs以了解有关python-selenium的更多信息并进行设置。

希望这会有所帮助

© www.soinside.com 2019 - 2024. All rights reserved.