我正在开发一个基于 RAG 的聊天机器人来搜索我的内容。我已将所有内容上传到 Blob 存储,并将 Blob 存储导入到 Azure AI 搜索服务中。我尝试使用索引/索引器,但索引仅基于字段进行操作,而我想搜索所有内容。有没有其他方法可以实现这一目标?
我还希望添加到我的 blob 容器中的任何新数据都自动包含在 Azure AI 搜索中。
我尝试使用索引/索引器,但索引仅基于字段进行操作,而我想搜索所有内容。有没有其他方法可以实现这一目标?
根据您的捕获,您只有 1 个名为“id”的索引字段,我猜您错误地理解了索引的使用方式。考虑到您想要实现的目标,您需要首先使用适当的字段定义索引结构:
一旦您从文件中列出了所需的内容,并定义和创建了索引结构,那么您将使用“索引器”用数据填充索引。
例如,当您使用 Azure OpenAI Studio 中的“添加数据”选项卡时,它会自动为您创建所有内容。你最终会得到这样的索引结构:
这里:
我还希望添加到我的 blob 容器中的任何新数据都自动包含在 Azure AI 搜索中。
您需要定义索引器的处理频率以定期运行。您可以使用一些代码,例如通过使用带有“Blob 触发器”事件的 Azure 函数,您将在函数运行时为文档建立索引,因为它是在创建/修改 Blob 时触发的。