如何正确地将流式文本拆分成段落?

问题描述 投票:0回答:0

说我可以为方法

realtimeSplitStream
提供3个参数,即
stream
minSplitLength
maxSplitLength

stream
一个一个地发出字符,字符可以是任何主流语言,例如en-US, zh-CN, Russian, Arabic, ja-JP

然后该函数应该拆分该流并适当地给出长度在

minSplitLength
maxSplitLength
之间的字符串(例如,当构建段落或句子时。)

我可以接受偶尔的非完美分裂。

也欢迎任何其他想法,例如基于文本内容和时间的拆分。

我想用 Java 实现这个。

谢谢

java string text-processing
© www.soinside.com 2019 - 2024. All rights reserved.