我需要将 json 文件转换为矢量数据库。我使用 chromadb。
collection.add(
documents=["This is a document", "This is another document"],
metadatas=[{"source": "my_source"}, {"source": "my_source"}],
ids=["id1", "id2"]
)
此代码用于向集合添加新数据。如何给出一个包含复杂字段(例如某些字段具有数组值)的大 json 文件以保存到集合中。或者有没有更好的方法来保存矢量数据库而不是 chromadb
利用 JSON 输入文件并包含您感兴趣的向量字段以及其他字段(例如不可搜索的大文本),您始终可以利用 Astra DB 的数据 API。请参阅 https://docs.datastax.com/en/astra/astra-db-vector/api-reference/collections.html#the-indexing-option 了解如何开始使用。您可以索引所需字段并利用其他字段来存储大量内容并开始!另外,请查看文档的这一部分以查看支持字段数据类型的列表。