Form Recognizer是否有能力在Form Recognizer识别工具处理文档之前预先选择/预区分文档?
例如它将能够区分钞票或纸币,并且仅将识别工具用于钞票。
Azure表单识别器是一种认知服务,它使用机器学习技术从表单文档中识别和提取文本,键/值对和表格数据,无论它们是PNG,JPEG,TIFF还是PDF。
使用表单识别器,您无法找到文档类型或区分文档。您需要在提取数据之前训练任何类型的表单。
出于隔离的目的,您必须使用其他一些服务/工具。例如,可以使用Azure计算机视觉服务来查找图像的类型。
正如其他答案所建议的那样,您可以实现自己的分类器。您可以调用该模型,然后检查返回值的置信度得分,如果它太低,则不是要处理的文档。
如果您要构建2个模型,一个用于票据,一个用于票据,每个模型提取不同的键/值集,那么Form Recognize团队正在研究一项功能,以寻找最适合您的表单,请继续关注。
感谢
-xin(来自MSFT表单识别小组)
否,这不是Form Recognizer的功能。
例如,您可以使用Custom Vision实现自己的分类器(用于图像文档)>