如何在本地Kubernetes或OpenShift集群上运行Snakemake工作流程?

问题描述 投票:0回答:1

我们正在尝试在内部基础架构的Kubernetes上运行Snakemake工作流程。我们正在MapR文件系统上更精确地使用OpenShift OKD。

我们遵循了official documentation命令:

snakemake --kubernetes --use-conda --default-remote-provider $REMOTE --default-remote-prefix $PREFIX

但是为--default-remote-provider--default-remote-prefix提供的命令行帮助尚不清楚我们如何在本地Kubernetes或OpenShift集群上执行Snakemake管道:

--default-remote-provider: choose from 'S3', 'GS', 'FTP', 'SFTP', 'S3Mocked', 'gfal', 'gridftp', 'iRODS'

此外,官方文档指出:

在此模式下,Snakemake假定所有输入和输出文件都存储在给定的远程位置,方法是通过将$ REMOTE设置为您选择的提供程序(例如,GS用于Google云存储或S3用于Amazon S3)和$ PREFIX进行配置。该远程存储中的存储桶名称或子文件夹。

所以我想知道:

  • 如何将Snakemake工作流程部署到内部OpenShift / Kubernetes安装中?

  • 是否有在前提集群上运行Snakemake的示例(例如github repo或博客?)>

  • 特别是,我不确定应该选择哪个远程提供程序,以及如何提供前缀(可以将其链接到Kubernetes持久卷声明吗?]

  • 非常感谢您的帮助!

我们正在尝试在内部基础架构的Kubernetes上运行Snakemake工作流程。我们正在MapR文件系统上更精确地使用OpenShift OKD。我们遵循官方文档命令:...

kubernetes openshift workflow snakemake
1个回答
0
投票

对本地Kubernetes的设置不是很熟悉,但是this segment of snakemake's documentation on cluster execution may help.

© www.soinside.com 2019 - 2024. All rights reserved.