我正在使用Luigi进行依赖性解析,并且效果很好。
我还应该将Luigi用于“软”依赖吗?
让我解释一下。假设我当前的任务下载并处理了一些日期的数据。假设在那之后,我想运行一个遍历所有数据并输出一个简单摘要的脚本。不是每个日期一个摘要,而是一个关于所有已下载数据的摘要。
我称此为软依赖性,因为我希望最终脚本在所有日期的数据上运行,但是如果有几个日期无法下载,我仍然希望脚本在其他日期运行。
我应该如何为该用例组织任务,或者这不是Luigi的工作?
内部要求:您可以检查文件是否“存在”,如果存在,则可以“屈服”处理该文件的任务。
2是最简单的实现,因为所有处理都在1个任务中,并且更容易输出1个摘要文件。