我正在尝试为我的数据工程团队创建一个系统或环境。 要求是:
我通过在虚拟机上托管成功实现了第一个目标。第二种是使用 Airflow dags。第三种是使用 Dag 代码编辑器插件。 我的问题是第四个要求,无论我如何搜索和询问,我都无法弄清楚。 这可能吗?如果是的话怎么办。 附注我对其他系统(如 zeppelin 或 Spark 或任何可以提供帮助的系统(linux 或 windows))都满意
是的,可以创建具有用户访问控制的本地托管数据工程系统。实现此目的的一种方法是结合使用以下技术:
以下是该系统如何工作的高级概述:
以下是实施该系统的一些额外提示:
其他系统: 您可以使用许多其他系统来创建具有用户访问控制的本地托管数据工程系统。一些流行的选项包括:
您选择哪个系统将取决于您的具体需求和要求。如果您正在寻找一个易于使用且具有很多功能的系统,那么 JupyterHub 是一个不错的选择。如果您需要一个更具可扩展性和安全性的系统,那么您可能需要考虑使用 Apache Livy 或 Apache Knox。