将PDF指定为十六进制字符串时解析PDF日期

问题描述 投票:1回答:2

我正在为PDF文件编写解析器。日期,例如Info对象的CreationDate条目应该被指定为类似于以下内容的文本: -

(D:20190416162204+10'00')

这很容易解析,我的解析器处理它们就好了。但偶尔有PDF文件似乎使用Hex字符串格式指定日期,如下所示: -

<4B230449BFB5E413CB9C81A2F132EBB0DE>

PDF规范没有提到允许这种格式。如果将十六进制对转换为ASCII,则不会以先前的格式进行转换。任何人都会遇到这种格式的日期并知道如何解码它?

c# pdf
2个回答
1
投票

经过更多调查后发现日期和字符串可以加密,需要在被视为最终字符串之前正确解密。 PDF的/ Trailer具有/ Encrypt间接引用,这需要处理以设置您的解密例程。


-1
投票

实际上,PDF字符串是十六进制的,但在你的情况下,似乎字符串是错误的(可能它是用一个草率的pdf生成器创建的)

© www.soinside.com 2019 - 2024. All rights reserved.