我正在使用 azure AI 搜索实现 RAG。我已经创建了索引,总共有 2605 个文档块要上传到索引。我观察到的奇怪行为是:
我试图了解幕后发生的事情,因为我需要提供一个代码来处理小至 10 个块到大至 10000 个块的上传。 从网站上的文档来看,Azure AI 施加了某些限制。就像上传的文档不能大于16 MB,批量大小不能超过每批1000。这两个加在一起仍然不能解释为什么我无法加载批量大小为 600 的所有块,而批量大小为 900 时我却成功了。
我希望它能够加载块,而不管批量大小。
我使用Python SDK上传文档,上传成功。我尝试了 3k 和 10k 文档,它成功地将所有这些文档一次性上传到索引。
请参考以下代码。
import os
index_name = "hotels-2"
from azure.core.credentials import AzureKeyCredential
from azure.search.documents import SearchClient
search_client = SearchClient(service_endpoint, index_name, AzureKeyCredential(key))
def upload_document():
result = search_client.upload_documents(documents=hotels)
print("Upload of new document succeeded: {}".format(result[0].succeeded))
输出:
如果你看到了,文档的长度是
10000
。
在门户中:
有关更多信息,请参阅此 GitHub 存储库。