我下载了一个文件,并使用md5sum来查看下载是否成功而没有损坏。我得到以下值:
a7099fcf9572d91b10d0073b07e112cb ./Macaca_mulatta.MMUL_1.70.dna.chromosome.1.fa.gz
但是当我检查网站时,从中下载了文件,它给了我以下价值。
10256 63747 Macaca_mulatta.MMUL_1.70.dna.chromosome.1.fa.gz
这是10位数字的代码是什么?不是md5吗?
我从ftp://ftp.ensembl.org/pub/release-70/fasta/macaca_mulatta/dna/CHECKSUMS下载了文件
它们不是同一件事。 MD5是校验和,但还有其他非MD5的校验和算法,例如SHA,CRC等。
通常,校验和是一种函数,其输入的大小大于其输出,并且即使更改了输入中的一位,它(更好)也会产生截然不同的输出。
您正在查看的输出由两个5位十进制数字组成,因此您的校验和算法很可能是CRC32。 Unix sum
命令可用于计算/验证。
Ensembl使用Unix'sum'实用程序来计算CHECKSUM.gz文件。
有关此程序的更多信息:http://en.wikipedia.org/wiki/Sum_%28Unix%29
要查看您的下载是否正确,请尝试:
sum Macaca_mulatta.MMUL_1.70.dna.chromosome.1.fa.gz
[注意:发生在Ensembl没有更新其CHECKSUM文件之前,因此总会发生下载正确但CHECKSUM.gz文件不正确的情况。
MD5是一种执行校验和的方法,但是还有其他方法。 CRC是一个,SHA也是如此。 MD5所做的只是生成一个哈希码,它不是唯一的算法。我不确定10位数字是什么,但是不能是MD5。