ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何使用Python从PDF文件中提取图表/表格/图表?

搜索了不少但由于我找不到解决这类问题的方法,因此发布了一个明确的问题。大多数答案涵盖了相对容易的图像/文本提取。一世'...

回答 1 投票 1

深入学习图像分割/区域创建

我有一些包含医疗信息的图像。例如,患者姓名,医生姓名,出生日期,总计费金额。所有这些信息都处于图像的几乎固定的部分,并且......

回答 1 投票 0

(-215:断言失败)!函数'cv :: cvtColor'中的_src.empty()

我试图从图像中识别文本然后输出文本;然而,这个错误吐出:Traceback(最近一次调用最后一次):文件“C:/ Users / Benji's Beast / AppData / Local / ...

回答 4 投票 1

Tesseract OCR在TIFF文件上失败

我有一个多页.tiff文件,我试图使用Tesseract OCR从中提取文本,但我收到此错误TypeError:不支持的图像对象代码从PIL导入图像导入...

回答 2 投票 1

如何在Google Cloud Vision API中对作为较大句子的一部分的块进行分组?

我在Python上使用Google Cloud Vision API来检测通常位于商店/商店上方的囤积板中的文本值。到目前为止,我已经能够发现个别单词及其边界......

回答 1 投票 0

图像处理,以提高tesseract OCR的准确性

我一直在使用tesseract将文档转换为文本。文档的质量范围非常广泛,我正在寻找有关哪种图像处理可能会改善结果的提示。我发觉到 ...

回答 12 投票 117

如何提高tesseract ocr准确度? [重复]

我有一个PDF,其中包含扫描文档,我应该阅读它的一些部分。我已经完成了谷歌云OCR,但我只是注意到它可能不够,因为我会超过...

回答 4 投票 0

从PDF中提取表格数据,格式为图片[关闭]

我正在尝试从本文档第52页开始的表格中提取数据(FAA的报告)。问题是表格包含在图片中。我有机会得到一些指示......

回答 1 投票 2

Google Vision API文本提取数据准确性(DOCUMENT_TEXT_DETECTION)

使用JAVA SDK for GCP Vision API进行OCR(文本提取)。已移至功能TEXT_DETECTION到DOCUMENT_TEXT_DETECTION。我测试的图像名称为“Mohan D”。 TEXT_DETECTION:我......

回答 1 投票 0

使用Tesseract和OpenCV进行文本识别(OCR)中的链接器错误?

我已经编写了使用Tesseract和OpenCV来识别图像中的文本的代码。但是当我执行它们时,代码没有问题,但它显示了一些链接器错误。我正在使用tesseract4.0 ...

回答 1 投票 -1

如何改变opencv(阈值)中轮廓形成的面积

我正在尝试构建OCR以从Image中提取文本,我正在使用轮廓来形成文本字符的边界,经过几次改变cv2.threshold的试验后,我得到了最佳的轮廓...

回答 1 投票 0

使用Google应用脚本从PDF到文本转换获取文本

我有一个脚本可以从某些Gmail邮件中获取(可搜索的)PDF附件。现在我需要从这些pdf中提取一些String数据。是否有某种方法可以使用OCR -...将其添加到Google云端硬盘

回答 3 投票 2

abbyy finereader.exe寻找在其他程序中使用的cmd命令

我刚从另一个程序中购买了abbyy finereader 11 copr,但是我找不到任何可以用于finereader.exe的赞誉。所以没有任何命令它只是开放和扫描,但我需要......

回答 5 投票 7

Google Vision OCR数据表单

我正在探索适用于OCR的Google Vision API。我们有许多由用户计算机生成和填充的表单。像医疗报告和登记表一样。我们需要处理那些图像......

回答 2 投票 1

如何使用OCR从指定位置提取文本信息?

用户上传表格数据,包括课程,教授,日程安排等信息。我想轻松提取这些信息。我可以使用OCR库,但它只是随机输出文本...

回答 1 投票 1

从tesseract导入image_to_string时出现Python错误

我最近使用了tesseract OCR和python,当我尝试从tesseract导入image_to_string时,我一直收到错误。导致问题的代码:#使用tesseract-ocr库执行OCR ...

回答 4 投票 9

tesseract ocr不处理文本长度仅为2或更小的图像。适用于文本长度大于3的图像

从PIL导入导入pytesseract图像def textFromTesseractOCR(croppedImage):对于范围内的i(14):text = pytesseract.image_to_string(croppedImage,lang ='eng',boxes = False,...

回答 2 投票 0

使用Apache PDFBox从PDF文档中删除OCR文本

系统中的一些PDF文档是通过包含OCR文本进行扫描而创建的。但是,OCR没有正确执行(混合了西里尔字母和拉丁字符),虽然文档看起来像......

回答 1 投票 0

如何让索引服务和MODI在OCR上生成全文?

我已配置索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像。我还安装了MS Office 2003+并配置了MS Office Document Imaging(MODI)......

回答 1 投票 70

我如何将OCR文本存储到SQLite数据库中?

我正在开发一个例程应用程序,用于存储基于输入的关键字在公告板上发布的例程数据。例如,如果您来自A组(应该是某些唯一关键字),请输入...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.