用于包含数学和表格的 pdf 的最佳 OCR 工具

问题描述 投票:0回答:1

我开始开发一款专为数学考试量身定制的 examMaker 应用程序,此过程的关键部分涉及将大量数学考试从 PDF 转换为 LaTeX 格式。在尝试了各种工具和模型后,我发现只有两个选项被证明始终可靠:

1-Mathpix:

被广泛认为是将包含数学表达式和表格的图像和 PDF 转换为 LaTeX 的首要工具。然而,也有一些缺点: a- 它的价格很高。 b- 尽管功能强大,但它在处理包含大量数学方程的大型表格时遇到了困难,例如 Cambridge Markscheme 9709_s22_ms_11.pdf(链接 https://papers.gceguide.net/A%20Levels/Mathematics%20(9709)/2022/ 9709_s22_ms_11.pdf)。

2- InftyReader(版本 3.1.1.2):

虽然是较旧的版本并且仅非正式可用(通过 mod 版本),但它在准确性方面仅次于 Mathpix。

我尝试过的其他工具包括:

3- InftyReader(版本3.3.2.3,最新版本):

我不建议购买该软件,原因如下: a- 虽然相对便宜(大约 40 美元),但它无法提取对我的任务至关重要的图像,例如图表和函数图。 我 b- t 比旧的 mod 版本慢。 c- 不幸的是,许可证仅对最新版本有效,如果您想要更好的质量,则需要使用 mod 版本。

4- Meta Nougat(基本型号和小型型号):

这种将 PDF 转换为 LaTeX 的免费模型有其局限性: a- 即使在 Colab(免费版)等基于云的平台上运行,它的运行速度也很慢,大约需要 9 分钟才能处理 20 页的文档。 b- 输出通常不准确,缺少数字、文本和方程。 c-此外,它以 Markdown (MMD) 格式输出,需要进一步转换为 LaTeX。 对于那些有兴趣探索 Meta Nougat 的人,您可以参考本教程 (https://www.youtube.com/watch?v=SYO_4uhdHKM )。但是,根据我的经验,由于其速度和准确性问题,我建议谨慎。

在投入大量时间进行研究和实验后,我得出了这些结论,希望能为面临类似任务的其他人节省宝贵的时间。这些见解是经过大量试验和错误得出的,我相信它们将为任何人在复杂的 PDF 到 LaTeX 转换工具领域提供有用的指南。

其他工具,我不知道

pdf math latex ocr equation
1个回答
0
投票

我正在使用 LayoutLMV3 解决与您类似的问题。 你可以检查一下!

也许我们可以改变想法!

© www.soinside.com 2019 - 2024. All rights reserved.