首先我要说的是,我不确定我是否正确使用了这个库。
from ABBYY import CloudOCR
ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}
result = ocr.process_and_download(
file,
exportFormat='xml,pdfTextAndImages',
language='English'
)
print(result)
这是我得到的错误:
requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English
如果我点击错误回溯中的链接,我会看到以下文本:
404 HTTP method GET not supported for /processImage, only method POST supported
我正在尝试将本地 PDF 发送到云 OCR 平台。我已经成功使用了here找到的包,如下所示:
$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt
我想使用方法#1 实现一个系统。我只是想知道该怎么做才能实现这一点。方法 #2 有效的事实表明身份验证不是问题。
State: -- 我也遇到同样的问题,使用这两种方法。
解决方案 -- 如果您的 Application_ID 和密码正确,您仍然会收到相同的错误,原因是您在注册表中选择了 UK 或 US 注册。
美国和英国都有不同的 ServerUrl:
根据位置更改了 AbbyyOnlineSdk.py 中的 ServerUrl。
我的任务通过了!
希望这有帮助。