培训计算机视觉OCR

问题描述 投票:-1回答:1

我设置了Azure计算机视觉服务,并在我的应用程序中使用。 当我尝试对一些图像执行OCR时,它没有识别所有的文本(即漏掉 "杯子 "中的 "S").当文本没有被正确识别时,它可以在OCR中进行训练重训吗?

computer-vision ocr azure-cognitive-services
1个回答
0
投票

当OCR工具能够检测到所有的文字时,并不总是如此。您可以尝试在将图像发送到 azure 之前对一些图像进行预处理。预处理


0
投票

根据你提供的图片和信息,我很快就查到了计算机视觉API的输出,其中有几种文字处理的操作。

  • OCR:原始的,同步的
  • 识别文本:第2个,异步的,最后一个将被废止
  • 批量读取(2.0 & 2.1)> 读取(3.0):最新的一种,也是异步的。

从结果质量来看,Read操作比较好,特别是对于旋转的项目和其他情况。

下面是各家输出的示例,用你的图片(https:/moderatorsampleimages.blob.core.windows.netsamplessample2.jpg。),用Cognitive Workbench生成。网站,一个认知服务的开源演示。

OCR

Ocr

你可以看到一些错误。

  • "CAPABLE "后面有一个 "*"
  • "OURSELVE "缺少 "S"。
  • 最后一个句号是逗号

识别文本

RecognizeText

这里唯一的问题是最后少了一个句号。

批量读取

BatchRead

这里唯一的问题是最后少了一个句号。

结论:使用现在已经普遍可用的Read 3.0。API链接。https:/westeurope.dev.cognitive.microsoft.comdocsservicescomputer-vision-v3-gaoperations5d986960601faab4bf452005。

© www.soinside.com 2019 - 2024. All rights reserved.