我是一名生物信息学学生,我尝试使用 Snakemake 来完成映射步骤。我使用的是Linux环境。这是我第一次使用snakemake,我在代码中遇到了我不理解的问题。这是我的蛇makefile;
# samples, = glob_wildcards('/../data/01-trimmed/-{sample}_S0.fastq.gz')
samples = ["Input_Si_B-Catenin_HepG2_S0"]
#reads = ["1","2"]
rule all:
input:
# QCreads= expand("..*(I specified the right path)*/data/QC-{s}_L001_R1_001_fastqc.html",s=samples),
# trimmed=expand("../data/fastq/{s}_R1_trimmed.fastq.gz",s=samples),
# QCreads2= expand("../data/QC/{s}_R2_trimmed_fastqc.html",s=samples),
map=expand("../data/04-mapped/{s}.bam",s=samples),
#insertsize=expand("../data/QC/{s}.insert.metric.tab",s=samples)
#
rule bowtie2:
input:
R1="../data/01-trimmed/{sample}_R1.fq.gz",
R2="../data/01-trimmed/{sample}_R2.fq.gz"
output:
"../04-mapped/{sample}.bam"
threads: 10
shell:
"""
module load bowtie2/2.4.4
module load samtools/1.15.1
bowtie2 --phred33 --local -p {threads} -x /../hg38 -1 {input.R1} -2 {input.R2} | samtools view -bhS > {output}
samtools stats {output} > ../04-mapped/{wildcards.sample}_raw_stats.txt
"""
它总是给我这个错误:
Building DAG of jobs...
MissingInputException in rule bowtie2 in file /../data/snakefile_mapping, line 15:
Missing input files for rule bowtie2:
output: ../04-mapped/Input_Si_B-Catenin_HepG2_S0.bam
wildcards: sample=Input_Si_B-Catenin_HepG2_S0
affected files:
../Input_Si_B-Catenin_HepG2_S0_R2.fq.gz
../Input_Si_B-Catenin_HepG2_S0_R1.fq.gz
有人可以给我解释一下吗? 提前致谢! :)
我尝试纠正路径,但它总是给出同样的问题。我正在使用 Bowtie2 进行配对端映射,并尝试在一个样本上进行试运行以进行测试,但总是出错! 我指定了 .yaml ,它很好
snakemake 找不到文件 ../Input_Si_B-Catenin_HepG2_S0_R2.fq.gz 和 ../Input_Si_B-Catenin_HepG2_S0_R1.fq.gz
您可以尝试绝对路径只是为了让它运行(使用 -n 标志来检查它是否工作而不实际运行它)。如果这有效,您可以更改相对路径,或者使用
在蛇文件中设置工作目录工作目录:“路径/到/工作目录”
因此相对路径确实指向正确的位置。