训练过程中已丢弃的事件消息OpenNLP DocumentCategorizerME()?]

问题描述 投票:1回答:1

我有可标记的数据(标签和文本),如下所示:电子产品

,家用游戏机配件电子产品,便携式游戏机配件电子产品,视频游戏机食品,酒精食物,酒精

我尝试使用Java OpenNLP库训练我的分类模型。DoccatModel model = DocumentCategorizerME.train("pt", sampleStream, params, customFactory);当我训练模型时,我会收到以下消息:使用5的截止值索引事件

计算事件计数...完成。 5441个事件掉落的事件动物:[弓=活着,弓=动物,ng =:活着:动物]掉落的事件动物:[弓=水族馆]掉落的事件动物:[弓=水生,弓=植物,弓=肥料,ng =:水生:植物,ng =:水生:植物:肥料,ng =:植物:肥料]丢下的活动服装:[蝴蝶结=运动装]掉落的事件服装:[弓=一,弓=件,ng =:一:件]

为什么会发生,这意味着掉落事件“ 类别

”:[....]?

我有标记数据(标签和文字),例如:电子产品,家用游戏机配件电子产品,便携式游戏机配件电子产品,视频游戏机食品,酒精饮料,...

java training-data opennlp categorization
1个回答
0
投票

尝试添加自定义工厂

© www.soinside.com 2019 - 2024. All rights reserved.