CTC有办法输出不同类型的空白吗?

问题描述 投票:0回答:0

我在 Tensorflow/Keras 中使用 CTC 损失进行数学手写识别。输出由一系列符号 ID 组成,每对连续符号之间具有空间关系。例如,方程 rac{x+y}{2} 将表示为 [id 表示 x]、[id 表示“右”空间关系]、[id 表示 +]、[id 表示“右”]、[id对于 y],[“NumeratorToFractionBar”关系的 id],[分数条符号的 id],...

我使用贝塞尔曲线序列对手写数据进行编码。 每个手写笔画——无需将笔从设备上取下的连续绘图——都可以用多条曲线表示。例如,字母“x”是两笔画。 我想在每个笔划(不是贝塞尔曲线,笔划)之间添加一个符号的端点到下一个符号的起点之间的一条线(由贝塞尔曲线表示),这让 CTC 输出空白symbol 知道新符号从哪里开始。见附图。 但是,我还希望非笔画能够表示其前后符号之间的空间关系,而空白则不能。

对于 rac{x+y}{2} 的示例,我会在 x 和 y、y 和 fractionbar 以及 fractionbar 和 2 之间设置偏移笔划。

我应该怎么做?对不起,如果它令人困惑,如果您有任何问题,我会澄清。

python machine-learning bezier handwriting-recognition ctc
© www.soinside.com 2019 - 2024. All rights reserved.