随着时间的推移,我将导入大量数据(18GB,300万个文档),几乎所有数据都已建立索引,因此正在进行许多索引工作。该系统由一个客户端(在单独计算机上的单个进程)建立一个单一连接(使用pymongo)并以1000个文档为批处理执行insertMany
。
MongoDB设置:
当我启动服务器(完全重新引导后)并插入集合时,需要1.5个小时。如果服务器在插入其他数据(从单个客户端)时运行了一段时间,它就完成了数据的插入,我删除了集合并运行了相同的数据以进行插入-插入它需要6个小时(仍然有足够的磁盘)超过60%,则没有其他连接到数据库的信息)。感觉服务器性能会随着时间的推移而下降,这可能取决于操作系统。有类似的经验,想法吗?
由于您没有提供任何特定的详细信息,因此建议您启用分析;这将使您检查性能瓶颈。在mongo shell上运行: