ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

能够从图像中获取带有位置的文本......我怎样才能形成句子?

我正在使用在线图书馆,能够从图像中获取带有位置的文字。现在我想形成与图像完全相同的句子。知道我该怎么办?早些时候我用过......

回答 1 投票 0

OCR的理想字体是什么?

有没有人有OCR不同字体的经验?我正在生成一个ID,然后尝试用tesseract扫描它。目前我只是T&E'n不同的字体,但这看起来很漂亮......

回答 7 投票 27

如何OCR MODI.Document的特定区域?

我需要OCR扫描文档的特定区域,我正在使用MODI(Microsoft的Document Imaging COM对象)。我的代码目前OCR是整个页面(非常准确!),但我想......

回答 1 投票 0

如何用三种不同的笔迹训练相同数字的tesseract-ocr?

我在java中创建了一个程序,它从扫描的tiff图像中读取字符,但准确性不是那么好。如果我们改变文档中的手写,那么结果就会有所不同。那有......

回答 1 投票 1

用于从图像中提取特征的Python循环不能完全运行

我有以下代码,它使用Tesseract-OCR(python wrapper- tesserocr)从包含文本的图像中提取字体属性。对于image_list中的图像:print“Starting for”,...

回答 1 投票 0

Google Vision复杂的OCR执行,带有两列文本

对不起,如果此问题已在此处提出,但我无法找到答案。所以,我正在创建C#OCR程序以扫描商店收据。 Vision OCR DocumentTextDetection本身有效......

回答 1 投票 0

如何从图像中分离噪声和文本以进行OCR的预处理

我在电视镜头中对字幕应用OCR。 (我正在使用Tesseract 3.x w / C ++)我试图将文本和背景部分拆分为OCR的预处理。这是原始图像:并且......

回答 1 投票 0

确定标准化图像上的边界部分,并在python中进行相应裁剪

我为新手的错误道歉 - 我是一个真正的Python新手。对手头图像有一点了解以及为什么我要解析信息:附图是UB-04表格(或CMS-1450),它是......

回答 1 投票 1

API密钥在Google Cloud Vision API中的位置在哪里?

想要使用Google的Cloud Vision API进行OCR。在这里使用python示例代码我们有:def detect_text(path):“”“检测文件中的文本。”“”client = vision.ImageAnnotatorClient()with io.open(...

回答 1 投票 1

Tesseract OCR用户模式

有没有办法让Tesseract只匹配用户指定的单词或模式?该手册声称它是可能的,但我无法在互联网上找到一个有人记录的实例...

回答 1 投票 19

如何使用TextCleaner处理带有深色背景的浅色文本

正如标题所指出的那样,我收集的大多数图像都有深色背景和浅色单词,这使得tesseract很难识别嵌入的文本。任何人都知道如何用两种颜色交换......

回答 1 投票 1

训练手写数字的Tesseract:mftraining步骤需要永远

我一直在努力训练Tesseract 3.04以识别手写数字。该方法首先在以下链接中提供:https://arxiv.org/abs/1003.5897。我跟着......

回答 1 投票 2

C#MODI错误:图像中的OCR文本

我的应用程序在列表图像上使用OCR(modi SharePoint 2017)以返回包含此文本的所有图像。这是工作,但应用程序错误,并在一次停止。例如:我选择了32.000张图片,我称之为方法,...

回答 1 投票 0

Tesseract OCR水平读取而不是垂直读取C#

我们有一个C#.Net应用程序,它使用Tesseract在.tiff文件上进行光学字符识别(OCR)。这是一个例子:然后我们将数据输出到文本文件。然而,Tesseract是......

回答 1 投票 0

OCR:低对比度/嘈杂区域

我正在尝试识别下面显示的17个字符的代码。我目前正在使用OpenCV作为我的管道:(1)转换为B&W图像(2)计算梯度图像(3)Otsu阈值处理(4)查找...

回答 1 投票 3

WindowsError:[错误2]系统找不到为pytesseract指定的文件

我试图使用pytesseract进行OCR,但得到一个Windowserror。请帮助。来自PIL导入图像来自pytesseract导入image_to_string导入matplotlib.pyplot作为plt加载图像im ...

回答 1 投票 0

将长PDF页面拆分为多个页面

将一个很长的pdf页面拆分成单独的页面的最佳方法是什么?在这种情况下,单页图像由原来具有黑线的多个字母大小的页面组成......

回答 1 投票 0

如何使用tesseract -magickimage读取验证码

我在使用ImageMagick - tesseract读取验证码图像时遇到了一些问题。尝试了很多选项而失败了。这种格式实际上可以读取问题格式吗?提前致谢

回答 1 投票 0

使用单个列上的数据库定位器进行搜索,并且信心十足吗?

我已经使用Kofax Transformation Modules 3年了,我仍然不确定数据库定位器的工作原理。我有一个非常简单的数据库,有一堆列。我有一个非常简单的PDF ...

回答 2 投票 0

信用卡图像OCR

我想使用移动(Web应用程序)的后置摄像头捕获图像,然后提取文本,即卡号,有效期(使用OCR)。我设法访问移动的后置摄像头并拍摄了......

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.