我们正在尝试在内部基础架构的Kubernetes上运行Snakemake工作流程。我们正在MapR文件系统上更精确地使用OpenShift OKD。
我们遵循了official documentation命令:
snakemake --kubernetes --use-conda --default-remote-provider $REMOTE --default-remote-prefix $PREFIX
但是为--default-remote-provider
和--default-remote-prefix
提供的命令行帮助尚不清楚我们如何在本地Kubernetes或OpenShift集群上执行Snakemake管道:
--default-remote-provider: choose from 'S3', 'GS', 'FTP', 'SFTP', 'S3Mocked', 'gfal', 'gridftp', 'iRODS'
此外,官方文档指出:
在此模式下,Snakemake假定所有输入和输出文件都存储在给定的远程位置,方法是通过将$ REMOTE设置为您选择的提供程序(例如,GS用于Google云存储或S3用于Amazon S3)和$ PREFIX进行配置。该远程存储中的存储桶名称或子文件夹。
所以我想知道:
如何将Snakemake工作流程部署到内部OpenShift / Kubernetes安装中?
是否有在前提集群上运行Snakemake的示例(例如github repo或博客?)>
特别是,我不确定应该选择哪个远程提供程序,以及如何提供前缀(可以将其链接到Kubernetes持久卷声明吗?]
非常感谢您的帮助!
我们正在尝试在内部基础架构的Kubernetes上运行Snakemake工作流程。我们正在MapR文件系统上更精确地使用OpenShift OKD。我们遵循官方文档命令:...
对本地Kubernetes的设置不是很熟悉,但是this segment of snakemake's documentation on cluster execution may help.