Apache Solr : 数据导入处理异常 - 在资源中找不到'gs'操作符的SetGraphicsStateParameters名称。R7

问题描述 投票:0回答:1

在处理了21000个文档后,配置了数据导入处理程序来处理大量PDF文档。进程进入空闲状态,没有处理所有的文件。

当我看到日志观察到下面的事情。

请告诉我是否有任何方法可以让我忽略这个问题或任何设置,我需要更新。

 Error:

2020-04-23 18:39:55.749 INFO (qtp215219944-24) [ x:DMS] o.a.s.c.S.Request [DMS] webapp=/solr path=/dataimport params={indent=on&wt=json&command=status&_=1587664092295} status=0 QTime=0
2020-04-23 18:39:55.972 WARN (Thread-14) [ ] o.a.p.p.COSParser **The end of the stream is out of range, using workaround to read the stream, stream start position: 4748210, length: 2007324, expected end position: 6755534**
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{50, 0} from pages dictionary
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{60, 0} from pages dictionary
2020-04-23 18:39:55.997 ERROR (Thread-14) [ ] o.a.p.c.o.s.SetGraphicsStateParameters **name for 'gs' operator not found in resources: /R7**

DDJQSL+Wingdings字体中198(1)没有Unicode映射。

祝贺。

Ravi kumar

solr dataimporthandler
1个回答
0
投票

在分析文档后发现,有些文档的大小超过了500mb,所以solr出现了内存不足的异常,需要增加堆内存。

© www.soinside.com 2019 - 2024. All rights reserved.