我有一个DAG,可以将数据从源导入服务器。从那里,我希望从服务器下载该文件到Windows网络。我想将此部分保留在Airflow中以实现自动化。有谁知道如何在Airflow中这样做?我不确定是否使用os包,shutil包,或者可能有不同的方法。
我想你在说你正在寻找一种方法将文件从云端服务器转移到Windows共享驱动器或Windows网络中的计算机上,这些是我见过的一些选项:
所有这些都应该可以通过Airflow使用python(shutil
)或bash脚本将文件传输到正确的目录以便其他进程获取或通过调用bash子进程来执行SCP的直接传输或通过git提交数据。您必须了解防火墙和网络设置的可能性。其中一些需要在Windows端协调任务(例如,git选项需要某种类型的cron作业或任务调度程序来拉动存储库以使文件保持最新)。