假设我有一个可重复的模式,例如4个随机字节,4个可预测字节,4个新的随机字节,相同的4个可预测字节的随机数据,依此类推。放气的东西可以很好地压缩吗?
4个字节太短以至于无法很好地压缩吗?deflate是否对像这样的交错可压缩/不可压缩数据有任何内置支持?其他通用压缩格式是否可以更好地处理此模式?
您必须定义“ well”,但是是的,deflate可以并且将利用重复短至三个字节的字符串的优势。
没有什么比试一试了。我生成了100,000组的四个随机字节,后跟四个零,所以总共有800,000字节。 gzip将其压缩到大约500,000字节。