我正在尝试将snakemake用于生物信息学管道。为了测试它,我制作了以下snakefile。
我有一个包含各种fastq.gz文件的目录(例如K1_R1.fastq.gz,K1_R2.fastq.gz,K2_R1.fastq.gz等),并且我正在其中运行fastqc。
SAMPLES = [ "K1", "K2", "W1", "W2" ]
REPLICATE = ['R1', 'R2']
PathtoWD = '/home/hbanduk/scratch/working_projects_2020/'
rule fastqc:
input:
"expand(PathtoWD + "/raw_data/{sample}_{replicate}.fastq.gz", sample=SAMPLES, replicate=REPLICATE)"
output:
PathtoWD + "/fastqc_raw_reads/{sample}_{replicate}_fastqc.zip",
PathtoWD + "/fastqc_raw_reads/{sample}_{replicate}_fastqc.html"
shell:
"fastqc {input} -o /home/hbanduk/scratch/working_projects_2020/fastqc_raw_reads"
当我跑步时,
snakemake -np snakefile
我收到以下错误:
SyntaxError in line 9 of
/scratch/hbanduk/working_projects_2020/Snakefile:
invalid syntax
我已经尝试过对该文件进行许多排列,但是我一直收到相同的错误(有时是其他行)。
任何输入将不胜感激。
Chris_Rands关于双引号内的双引号的观点应解决语法错误,但是您可能希望完全删除expand()
周围的引号。即:
expand(PathtoWD + "/raw_data/{sample}_{replicate}.fastq.gz", sample=SAMPLES, replicate=REPLICATE)
代替
"expand(...)"