我有一个包含数千列的索引。我尝试在群集中索引10,000,000个文档。它花费大约3个小时。
我试过some methods来提高索引速度,但仍然很慢。
如何通过数千个字段和超过100,000,000个文档来提高此类索引的速度?
群集的硬件配置是什么? Java堆有多少内存?多少个核心?你的磁盘速度是多少?
此外,您的基础设施在哪里?在内部或云服务?
你真的需要文档中的所有字段吗?您的索引的映射如何?
如果你已经尝试过这些方法来提高性能,那么你可以做的其他事情就不多了,数百万个文档中每个数千个字段都需要时间来索引。