如何在Langchain中运行多进程Chroma.from_documents()

问题描述 投票:0回答:1

当我们在 Langchain 中调用 Chroma.from_documents() 时,我们能以某种方式传递运行多个线程/进程的选项吗?

我正在尝试嵌入 980 个文档(嵌入模型是 CUDA 上的 mpnet),但它需要很长时间。 眼镜: 软件:Ubuntu 20.4(在Win11 WSL2主机上),Langchain版本:0.0.253,pyTorch版本:2.0.1+cu118,Chroma版本:0.4.2,CUDA 11.8 处理器:Intel i9-13900k,所有 8 个 P 核均为 5.4Ghz,其余 16 个 E 核均为 4.3Ghz。 GPU:RTX 4090 GPU

python embedding langchain multiprocessor chromadb
1个回答
0
投票

Chroma 现在支持多线程,所以这在技术上应该是可行的。为什么不简单地导入线程并生成多个加载器?

© www.soinside.com 2019 - 2024. All rights reserved.