最大限度地减少小数.csv文件文件大小

问题描述 投票:2回答:2

我需要适应尽可能多的信息,我可以到一个小的文件大小。在这种情况下,该数据是在以逗号分隔的格式和所有的值被存储为2DP小数(无标题)。

我当时一看,我的理解是,我需要的所有文字使用的是我现在用我的标准.txt文件ASCII(每个字符1个字节)存储。显然ASCII有256个可能的值,这是远远比我更需要 - 我可能只有16个字符度日。

我可以节省我的数据在某种4bit的文本文件?我将创建一个使用C#中的文件(所有的谷歌搜索导致意见上做一个文本文件,而不是如何让一个较小的“字体”文本)。请问这样做节省任何空间到底呢?我可以压缩任何东西之前,我把它,但想法任何意见,以获得文件大小下来,将不胜感激。

c# ascii filesize
2个回答
2
投票

[文件]它将由一块C#代码读

因此,您所控制的序列化格式。你可以选择任何你喜欢的格式。

一个快速的方法,以节省空间和重用现有的代码是压缩CSV。 Gzip已是内置的,但它是相当薄弱。您可以使用7-Zip的库。所述的7-Zip算法是本领域的状态。如果将摆脱造成小数点并大多采用0-9的冗余。它不会删除的100%,但99%(?)。

您可以通过使用更好的格式,使这更有效率。您可以使用BinaryReader/Writer很容易写的东西完全自定义的。

协议缓冲区是有点更容易,也非常紧凑。


0
投票

我认为这个问题是合法的,但得到的答复是,你强加留下任何地方的任何解决方案逻辑条件。

所以,如果你能避免您的自定义结构CSV结构可以为您节省的东西,但你需要它,它几乎决定了你的解决方案。唯一的变数左边是你如何编码的文本,但你不能将文本编码少于8位,你可以使用像Unicode的更高的值(16位)。

我不会使用压缩,你已经提到过,您正在寻找备选答案,你意识到这一点评论。

© www.soinside.com 2019 - 2024. All rights reserved.