我试图实现 LZ 压缩......并试图使用它压缩一些文件......但我遇到了一些逻辑问题...... 我真的不知道如何将数据存储回文件...... 真正的问题是:假设我有一个匹配的字符串“ls”[表中的条目已经在第 289 个索引处完成],如果在文件中用 ls 替换 289 那么该怎么做? 因为如果之前的“ls”占用 2 个字节,那么现在 289 将占用 3 个字节。 如果上述是正确的那么为什么这种方法被称为压缩,如果不是那么正确的方法是什么...... 我只需要一个能特别详细地澄清我这个逻辑的答案。
到目前为止我已经编写的一些代码:
int main()
{
int id,flag,d;
char ch,a[2],newstr[1000],currstr[1000];
FILE *fr;
FILE *fw;
createTable();
fr=fopen("old.txt","rb");
fw=fopen("new.txt","wb");
flag=0;
fscanf(fr,"%c",&ch);
fprintf(fw,"%c",ch);
a[0]=ch;
a[1]='\0';
strcpy(currstr,a);
while(!feof(fr))
{
showTable();
fscanf(fr,"%c",&ch);
a[0]=ch;
a[1]='\0';
strcat(currstr,a);
strcpy(newstr,currstr);
id=lookTable(newstr);
if(id!=5000)
{
strcpy(currstr,newstr);
flag=1;
d=id;
}
else
{
if (flag==0)
{
fprintf(fw,"%s",a);
}
else
{
fprintf(fw,"%d",d);
printf("%d new data\n",d);
}
addEntry(newstr);
strcpy(currstr,a);
flag=0;
}
}
fprintf(fw,"%s",currstr);
fclose(fr);
fclose(fw);
return 0;
}
通常,压缩数据不会存储为文本文件,因此您的值
289
可能不应该存储为文本'2', '8', '9'
,而是作为两个字节的多个289
(289/256 = 1
和) 289%256 = 33
)。
您显然必须对所有(子)字符串执行此操作,并将翻译表存储在输出文件中,以便您可以再次将其翻译回来。