我们正在开发一个与我们的系统一起使用的Pdf解析器。要求是这样的,我们将所有信息存储在任何pdf文档上,并且应该能够复制文档(与原始文档的更改很少)。
我们做了一些谷歌搜索,发现iTextSharp是我们目的的最佳伴侣。我们正在使用.net开发我们的项目。
您可能已经猜到了我在标题中提到要求比较特定版本的iTextSharp(4.1.6 vs 5.x)。我们知道4.1.6是具有LGPL / MPL许可证的iTextSharp的最后一个版本。 5.x版本是AGPL。
我们希望在选择LGPL版本之前对版本进行很好的比较,或者我们购买AGPL的许可证(我们不想发布我们的代码)。
我做了一些浏览iTextSharp中的修订更改,但我想知道是否存在任何内容,在版本之间进行了很好的比较。
提前致谢!
我是iText Software的首席技术官,所以就像Michaël在评论部分已经有answered一样,我同时也是最权威的来源以及有偏见的来源。
有一个非常简单的比较图表on the iText web site。
此图表不包括文本提取,因此请允许我列出自iText 5以来的相关改进。
你可能也发现了this page。
如果您想知道错误修复和文本解析的性能改进,这是一个更详尽的列表:
如果不升级,有些事情是你无法做到的。例如,您将无法执行these slides中描述的操作。
如果你看看the roadmap for iText,你会发现我们将来会花更多的时间在文本提取上。
老实说:使用5岁版本不仅仅是重新发明轮子,也可能就像落入我们在过去5年中遇到的每一个陷阱。我可以向您保证,购买许可证会更便宜。