因此,我正在尝试在Android中实施个人项目,您可以从购物中心扫描不同的收据。我想通过自动化尽可能多的活动来提出一个模块,帮助用户手动输入一点点。情况是:
收据示例:
这看起来像一个项目的想法,而不是编码问题。
我建议的一件事是从边界框的相对位置猜测块。
但这是一个具有挑战性的研究问题。也许Vision API会打开一些功能,让客户直接了解收据。
要逐行获取文本,您需要设置一个自定义逻辑,该逻辑将根据Google Vision API返回的符号处理行,这可能与以下步骤一致:
TextAnnotation
中返回的所有符号的集合string
)与所有其他符号X坐标创建一条线givenSymbol.BoundingBox.Vertices[2].X
。